超越谷歌中国开源项目PaddleOCR登顶GitHub最受欢迎OCR项目

2026-03-30 19:22:14 来源: 科技日报点击数：

科技日报记者都芃

日前，百度文心衍生模型PaddleOCR在开源平台GitHub上的Star数突破73.3K，首次超越谷歌旗下开源OCR（光学字符识别）标杆产品Tesseract OCR（73.2K），成为全球Star数最高的OCR项目。

Tesseract OCR诞生于1985年，是OCR领域的技术标杆，长期位居GitHub OCR领域Star数榜首。此次被Paddle OCR超越，标志着这一标杆正在被新一代技术体系改写，也是大模型驱动下中国开源项目首次在OCR领域超越谷歌主导的标杆产品。

PaddleOCR基于文心大模型训练，是文心大模型多模态能力的重要部分，支持超100种语言识别，用户覆盖160个国家和地区。1月29日，新一代文档解析模型PaddleOCR-VL-1.5在OmniDocBench V1.5榜单中取得了全球SOTA（顶尖水准）成绩。

近年来，大模型成为OCR领域快速发展的重要动力。数据显示，PaddleOCR在GitHub上的Star数自2024年起呈现爆发式增长。2025年以来，OCR成为大模型厂商重点布局方向，DeepseekOCR、HunyuanOCR、GLM OCR等产品相继发布。

目前，PaddleOCR已同步升级服务能力：官网免费每日解析页数由1万提升至2万，用户还可通过OpenClaw直接调用PaddleOCR Skill，免费获取高精度PDF解析能力。与此同时，PaddleOCR OCEAN生态联盟正式成立，面向核心开源贡献者、深度企业用户及全球平台伙伴开放，首批成员包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平台伙伴，将共同推动OCR技术在更广泛场景中的应用落地。

（受访单位供图）

责任编辑：冷媚

网友评论

最热评论

没有更多评论了

超越谷歌中国开源项目PaddleOCR登顶GitHub最受欢迎OCR项目

友情链接

抱歉，您使用的浏览器版本过低或开启了浏览器兼容模式，这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级，继续浏览

超越谷歌 中国开源项目PaddleOCR登顶GitHub最受欢迎OCR项目

友情链接

抱歉，您使用的浏览器版本过低或开启了浏览器兼容模式，这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级，继续浏览

超越谷歌中国开源项目PaddleOCR登顶GitHub最受欢迎OCR项目