通义千问开源Qwen2.5模型发布 阿里云CTO周靖人:全面投入升级AI大基建

2024-09-20 15:31:46 来源: 科技日报 点击数:

科技日报记者 崔爽

9月19日开幕的云栖大会上,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型。

据介绍,相比Qwen2,Qwen2.5模型整体性能提升18%以上,拥有更多知识、更强编程和数学能力。Qwen2.5支持128K的上下文长度,可生成最多8K内容;支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等29种以上语言;能够响应多样化的系统提示,实现角色扮演和聊天机器人等任务。在指令跟随、理解结构化数据(如表格)、生成结构化输出(尤其是JSON)等方面,Qwen2.5进步明显。

自从2023年8月开源以来,通义在全球开源大模型领域成为开发者尤其是国内开发者的首选模型。性能上,多次登顶Hugging Face全球大模型榜单;生态上,与海内外开源社区、生态伙伴、开发者共建生态网络,截至2024年9月中旬,通义千问开源模型下载量突破4000万,Qwen系列衍生模型总数超过5万个,仅次于Llama模型。

发布会现场,阿里云CTO周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。

过去两年,模型尺寸已增长数千倍,但模型的算力成本正在持续下降,企业使用模型的成本也越来越低。周靖人强调:“这是AI基础设施全面革新带来的技术红利,我们会持续投入先进AI基础设施的建设,加速大模型走进千行百业。”

会上,阿里云宣布通义千问三款主力模型再次大幅降价,最高降幅85%,百万tokens价格低至0.3元。过去半年,阿里云百炼平台持续降低大模型调用的门槛,进一步推动大模型普惠。

应用成为大模型产业的主旋律。据介绍,阿里云把大模型生态的繁荣作为首要目标,目前,魔搭社区已成为中国最大的模型社区,拥有超690万开发者用户,与行业合作伙伴合作贡献了超10000款模型。

“我们希望企业和开发者能以最低的成本做AI、用AI,让所有人都能用上最先进的大模型。”周靖人说。

(主办方供图)

责任编辑:李梦一

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览