科技新突破 | DeepSeek登上《自然》封面

2025-09-18 10:58:48 来源: 科技日报 点击数:

9月17日,梁文锋团队在《自然》杂志发表论文,介绍开源AI模型DeepSeek-R1采用的大规模推理模型训练方法。研究表明,通过纯强化学习训练大规模推理模型,可有效提升大语言模型推理能力并降低人类输入需求。该模型在数学、编程竞赛及STEM领域研究生水平任务中表现优异,如数学基准测试得分达77.9%(DeepSeek-R1-Zero)和79.8%(DeepSeek-R1)。模型以解决问题获奖励机制强化学习,减少训练成本与复杂性。团队称未来将聚焦优化奖励过程以提高推理可靠性。

(科技日报记者 张梦然 岳靓)

责任编辑:李梦一
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览