科技日报记者 崔爽
近日,联通元景万悟智能体开发平台发布了业界首个开源智能文档解析工具MinerU的昇腾910B NPU开源优化方案,目前已上线Github和华为昇腾技术社区。
文档解析主要是指将扫描件PDF、多格式网页、图文混排电子书等非结构化文档,转化为机器可识别、可编辑的结构化数据的过程。其为打通信息孤岛,将沉睡的数据转变为数据资产的关键环节。
作为一款开源的智能文档解析工具,MinerU专注于将PDF等文档高效转换为Markdown等结构化格式,它的出现大大提高了文档解析的效率。但MinerU在国产算力上部署难、成本高,成为业界痛点。
据介绍,此次发布的优化方案大大拓展和释放了MinerU文档解析工具在国产算力部署的应用场景,让部署周期缩短一倍。具体来看,联通元景万悟智能体开发平台基于原生MinerU,实现效率和性能的双重提升,如原生MinerU仅支持PDF及图片、仅支持英伟达GPU,元景万悟文档解析服务则新增Word、PPT等格式,支持英伟达GPU及昇腾910B,其还作为模型服务直接接入元景万悟平台。
据了解,元景万悟智能体开发平台主要通过高效图模式推理、前后处理深度优化两项技术优化,实现了推理速度的显著提升。

网友评论