联通元景万悟发布MinerU 昇腾方案

2025-10-29 15:50:06 来源: 科技日报 点击数:

科技日报记者 崔爽

近日,联通元景万悟智能体开发平台发布了业界首个开源智能文档解析工具MinerU的昇腾910B NPU开源优化方案,目前已上线Github和华为昇腾技术社区。

文档解析主要是指将扫描件PDF、多格式网页、图文混排电子书等非结构化文档,转化为机器可识别、可编辑的结构化数据的过程。其为打通信息孤岛,将沉睡的数据转变为数据资产的关键环节。

作为一款开源的智能文档解析工具,MinerU专注于将PDF等文档高效转换为Markdown等结构化格式,它的出现大大提高了文档解析的效率。但MinerU在国产算力上部署难、成本高,成为业界痛点。

据介绍,此次发布的优化方案大大拓展和释放了MinerU文档解析工具在国产算力部署的应用场景,让部署周期缩短一倍。具体来看,联通元景万悟智能体开发平台基于原生MinerU,实现效率和性能的双重提升,如原生MinerU仅支持PDF及图片、仅支持英伟达GPU,元景万悟文档解析服务则新增Word、PPT等格式,支持英伟达GPU及昇腾910B,其还作为模型服务直接接入元景万悟平台。

据了解,元景万悟智能体开发平台主要通过高效图模式推理、前后处理深度优化两项技术优化,实现了推理速度的显著提升。

责任编辑:李梦一
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览