豆包1.5与商汤日日新V6并列国内第一

2025-05-30 18:16:08 来源: 科技日报点击数：

科技日报记者罗云鹏

5月28日，SuperCLUE《中文大模型基准测评2025年5月报告》出炉，豆包1.5·深度思考模型（Doubao-1.5-thinking-pro）和商汤日日新V6多模态模型（SenseNova-V6 Reasoner）共同摘金，超越Gemini 2.5 Flash Preview，在国内大模型第一梯队领跑。

位居第二梯队的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

报告指出，国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中，Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表现最为亮眼。国内推理模型竞争格局初露端倪。

该报告聚焦通用能力测评，涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本理解与创作六大任务，总量为1579道多轮简答题。

责任编辑：冷媚

豆包1.5与商汤日日新V6并列国内第一

友情链接

抱歉，您使用的浏览器版本过低或开启了浏览器兼容模式，这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级，继续浏览