蚂蚁发布并开源万亿参数思考模型Ring-1T

2025-10-15 13:00:27 来源: 科技日报 点击数:

科技日报记者 崔爽

10月14日,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。据介绍,Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力。

据了解,为持续激发Ring-1T的数学等复杂推理能力,此次百灵团队挑战了难度更高的IMO2025(国际数学奥林匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅用一次解出了第1、3、4、5题,相当于IMO银牌水平,成为首个能拿IMO国际奥数奖的开源系统。

万亿参数思考模型训练的最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。在Ring-1T模型中,蚂蚁采用了自研的“棒冰(icepop)”算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。此外,应对万亿参数模型强化学习训练,蚂蚁还自研高性能强化学习系统ASystem(其中包含已开源的高性能强化学习框架AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模RL训练稳定跑成日常。

百灵团队透露,Ring-1T模型是其在万亿思考模型上的首次尝试,团队会在后续的版本中继续完善模型性能。目前,用户可通过HuggingFace平台、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。

数据显示,蚂蚁百灵大模型已经发布18款模型,形成从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中包括两款万亿参数模型——万亿参数通用大语言模型Ling-1T、万亿参数思考模型Ring-1T。随着两款万亿参数模型的发布,百灵大模型也正式步入2.0阶段。

责任编辑:孙莹
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览