科技日报记者 江耘
7月23日,阿里巴巴开源全新通义千问AI编程大模型Qwen3-Coder。其编程能力表现出色,进入全球开源模型前列,并在部分评测中接近GPT-4.1和Claude4的水平。Qwen3-Coder是千问系列中首个采用混合专家架构的代码模型,总参数达4800亿,激活参数约350亿,原生支持256K token上下文,并可扩展至100万长度。该模型基于7.5TB、代码占比70%的数据进行预训练,并在后训练阶段强化了编程与智能体任务的学习,整体能力显著提升。
在Agent能力评测中,Qwen3-Coder在多个基准测试中表现优异,刷新了开源模型的纪录。在SWE-Bench等考察模型自主规划能力的评测中,其表现处于开源模型领先水平。Qwen3-Coder具备较强的多步骤任务处理能力,能够自主安排任务流程,调用多种工具完成复杂编程任务,尤其适用于网页开发、AI搜索、深度研究等场景。
Qwen3-Coder可帮助开发者高效完成代码编写、补全等基础任务,显著提升开发效率。同时,它也降低了编程入门门槛,使非专业用户通过自然语言即可完成较为复杂的编程操作。该模型已在魔搭社区、HuggingFace等平台开源,全球开发者可免费下载使用,并将逐步接入通义灵码等阿里AI编程产品。
目前,千问系列编程模型全球下载量已超过2000万次。阿里巴巴内部及多家行业头部企业,如一汽集团、中国石油、建设银行、平安集团、南方航空、小鹏汽车等,均已开始应用千问AI编程模型,推动AI技术在实际业务中的落地应用。