科技日报记者 都芃
日前,百度文心衍生模型PaddleOCR在开源平台GitHub上的Star数突破73.3K,首次超越谷歌旗下开源OCR(光学字符识别)标杆产品Tesseract OCR(73.2K),成为全球Star数最高的OCR项目。
Tesseract OCR诞生于1985年,是OCR领域的技术标杆,长期位居GitHub OCR领域Star数榜首。此次被Paddle OCR超越,标志着这一标杆正在被新一代技术体系改写,也是大模型驱动下中国开源项目首次在OCR领域超越谷歌主导的标杆产品。

PaddleOCR基于文心大模型训练,是文心大模型多模态能力的重要部分,支持超100种语言识别,用户覆盖160个国家和地区。1月29日,新一代文档解析模型PaddleOCR-VL-1.5在OmniDocBench V1.5榜单中取得了全球SOTA(顶尖水准)成绩。
近年来,大模型成为OCR领域快速发展的重要动力。数据显示,PaddleOCR在GitHub上的Star数自2024年起呈现爆发式增长。2025年以来,OCR成为大模型厂商重点布局方向,DeepseekOCR、HunyuanOCR、GLM OCR等产品相继发布。
目前,PaddleOCR已同步升级服务能力:官网免费每日解析页数由1万提升至2万,用户还可通过OpenClaw直接调用PaddleOCR Skill,免费获取高精度PDF解析能力。与此同时,PaddleOCR OCEAN生态联盟正式成立,面向核心开源贡献者、深度企业用户及全球平台伙伴开放,首批成员包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平台伙伴,将共同推动OCR技术在更广泛场景中的应用落地。
(受访单位供图)

网友评论