科技日报记者 杨雪
日前,字节跳动Seed团队公布2025高考全科测试结果。该测试采用全国新一卷和山东省自主命题,豆包Seed1.6-Thinking模型的文科和理科成绩分别达到683分和648分。在同期测试的国内外5款顶级模型中,豆包文科成绩获最高分,理科仅次于谷歌Gemini 2.5 Pro,后者成绩为655分。
测试结果显示,豆包的语文、英语、物理、历史、地理、政治六门学科获最高分,数学成绩也超过140分;DeepSeek R1获得数学最高分145分;Gemini 2.5 Pro以82分获得化学最高分,并与OpenAI o3一起获得生物最高分,成绩为77分。
Seed团队表示,首次测试时使用的网络版考卷清晰度较低,各大模型在化学、生物两门非常依赖图像的考试中丢分较多。该团队在获得更高清版本的高考试题图片后,采用图文交织的方式对化学和生物重新进行测试,发现豆包模型在这两科上能够提升近30分,理科总成绩可达到676分,验证了全模态推理可以更大程度激发模型的潜力。
据悉,山东省高考为“3+3”形式,语数英为基础学科,自选三门科目采用等级分数转换成绩。据山东当地资深高中老师分析,豆包赋分成绩组合,最高可达690分左右,参照2025年山东地区一分一段表,排名约在前80位,有望考上清华、北大等顶尖学府。