科大讯飞联手华为攻克全国产算力下推理模型训练难关

2025-01-15 19:05:14 来源: 科技日报 点击数:

科技日报记者 都芃

1月15日,科大讯飞发布了国内首个基于全国产算力平台的深度推理大模型——讯飞星火X1。该模型中文数学能力处于领先水平,已率先应用于教育、医疗等实际场景。同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。

讯飞星火大模型长期坚持全国产化路线,尽管在全国产算力平台上训练深度推理模型遭遇诸多挑战,但通过与华为携手合作,双方成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等系列难题,成功训练出首个基于全国产算力平台的具备深度思考和推理能力的大模型——讯飞星火X1。

在应用效果展示中,面对高考题、AIME(美国数学邀请赛)竞赛题以及高中奥赛题,讯飞星火X1不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。讯飞星火X1充分展现了深度推理模型的三大典型特征:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。

此外,讯飞星火4.0 Turbo底座能力也在本次发布后实现全新升级,七大核心能力全面提升。特别是针对行业、企业的痛点问题,其着重加强了在数学、行业知识、图文识别、长文本等方面的能力。

例如,此次基于讯飞星火X1的高质量合成数据,讯飞星火4.0 Turbo的数学能力得到增强,可以在数学教学、金融分析和科研推演等工作中更好帮助用户。图文识别能力则直接关乎着企业能否高效采编和利用行业、私域数据,是大模型“学习”的基础。讯飞星火4.0 Turbo图文识别能力升级后,使通用文档版面分析、文字识别准确率相对提升40%,复杂表格结构、潦草手写文字等方面识别准确率相对提升60%,大幅提升高价值数据获取能力。

同时,讯飞星火推出基于智能体的全新长文本框架,首发句子级溯源功能和混域知识搜索技术。这一新框架优化了超长注意力机制,同时利用大规模网页和书籍数据进行知识关联式合成,使得知识回复的错误率降低了40%,显著缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。混域知识搜索技术则能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大大提升信息搜索效率。

责任编辑:冷媚

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览