阿里开源三款中型千问3.5新模型

2026-02-25 23:01:02 来源: 科技日报 点击数:

科技日报记者 崔爽

2月25日,继除夕开源Qwen3.5-397B-A17B之后,阿里继续开源千问3.5系列模型。本次开源的三款中等规模的新模型包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B。基于架构创新和训练突破,三款模型均超越了更大尺寸的上代旗舰模型。

据了解,千问3.5模型采用混合注意力机制,结合高稀疏的MoE架构创新,并基于更大规模的文本和视觉混合Token上训练,新模型以更小的总参数和激活参数量,实现了更大的性能提升。

值得注意的是,千问3.5新模型可直接部署于消费级显卡,实现开发者友好。

数据显示,截至目前,阿里已开源千问模型超400个,全球下载量突破10亿次,衍生模型数超20万。同时,除夕开源的Qwen3.5-397B-A17B 模型已登顶Hugging Face全球榜首。

责任编辑:陈可轩
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览