谷歌霸主地位终结!百度PaddleOCR登顶GitHub全球第一,5M参数模型竟媲美GPT-4o

近日,百度开源项目PaddleOCR在GitHub上Star数正式超越谷歌老牌项目Tesseract,终结了后者长达20年的统治地位,成为全球排名第一的OCR开源工具。此次登顶得益于其技术实力的显著突破,刚刚入选CVPR 2026的PP-OCRv5模型参数量仅为5M,却在特定任务中展现出媲美千亿参数模型GPT-4o的性能。百度团队通过创新的“难度甜点区”数据策略,摒弃了单纯依赖架构堆叠的路径,转向更精细化的数据训练。此外,百度宣布将官网免费解析额度翻倍至每日2万页,并支持在OpenClaw中直接调用,进一步降低了AI应用门槛。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册