阿里通义开源模型Qwen2.5获OpenCompas评测榜冠军

2024-10-19 11:50:33 来源: 科技日报 点击数:

科技日报记者 崔爽

记者获悉,司南OpenCompass大语言模型评测榜9月榜单公布,阿里通义千问开源模型Qwen2.5-72B-Instruct成为该评测榜首个开源模型冠军。据了解,9月底通义千问开源模型Qwen系列的衍生模型数量首次超越Llama,成为全球最大的开源模型群。

 
据了解,司南OpenCompass是由上海人工智能实验室研发的大模型评测体系平台,OpenAI、阿里巴巴、智谱AI、Meta、零一万物等百余个主流大模型已加入评测。司南OpenCompass自建评测榜单每月一更,从语言、推理、知识、代码、数学、指令跟随、智能体等七大能力维度、十余项细分任务,对近期主流模型进行全面评测分析。

在2024年9月的司南OpenCompass榜单中,开源的Qwen2.5-72B以70.3分夺冠,首次超越Claude3.5和GPT-4o等闭源模型。Qwen2.5-72B-Instruct在此次榜单的多项能力测评中名列前茅。
司南OpenCompass评价称,Qwen2.5的登顶,标志着开源社区在模型领域取得快速进展,以Qwen2.5等为代表的国产主流厂商模型,在经历最新一轮技术迭代后,性能有了显著提升,展现了国产模型的强大竞争力。

(图片来自司南OpenCompass 官方网站)

责任编辑:李梦一

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览