面向Agentic时代 阿里云重构“芯-云-模型-推理”全栈技术体系

2026-05-20 18:01:41 来源: 科技日报 点击数:

科技日报记者 江耘

5月20日,在杭州西湖畔举行的阿里云峰会上,阿里云宣布完成“芯片-云-模型-推理”全栈Agent(智能体)化升级,并围绕Agent进行全栈产品发布。

阿里云资深副总裁刘伟光表示,Agent突破临界点之后可以24小时不间断工作,对AI和云的需求无穷无尽。阿里云通过全栈技术革新,从底层芯片、Agentic Cloud、模型到推理平台全面升级,建设中国最大的AI工厂。

峰会上,阿里发布基于新一代AI芯片真武M890的磐久AL128超节点服务器,搭载自研互联芯片ICN Switch 1.0,可让128张AI芯片组成一台计算机,主打解决Agent场景下的海量并发推理和大模型训练需求。

平头哥新一代训推一体AI芯片真武M890也在峰会首次亮相,性能是上一代真武810E的3倍。平头哥半导体副总裁高慧表示,在Agentic时代,一个Agent在执行任务时可能在毫秒间连续发起数十次模型调用,同时需要CPU、GPU、网络和存储等核心部件紧密协同。平头哥构建全栈自研芯片矩阵,核心就是希望实现算力、网力、存力的系统级协同,让每一个Agent都能流畅、稳定运行。

Agentic时代,云产品也需要进化。为此,阿里云对云产品进行了Skill化、MCP化和CLI化改造,让每一个云产品都变成Agent可以“像调函数一样调用”的标准化能力模块。

阿里云首席技术官李飞飞认为,传统云产品的交互逻辑是为人设计的——用户看着控制台点击按钮,或者通过API编写代码调用。但Agent工作负载是“无规律弹性、短生命周期、瞬时起量即走”,与传统云计算的稳态负载截然不同。

相比芯片和其它云产品,大模型应用是用户直接接触到的人工智能。峰会上,阿里巴巴通义大模型事业部负责人周靖人表示,阿里最新发布的旗舰大模型——Qwen3.7-Max实现仅凭一份任务说明,从零开始自主工作35小时,独立完成了一个生产级AI计算内核的编写与调优,最终性能较官方版本提升10倍。

没有人类干预,没有中间指导,35小时,从零到生产级。这个案例的示范意义在于:它展示的不是模型“回答问题”的能力,而是模型“自主完成复杂工程任务”的能力,这正是Agent场景最核心的需求。

“大模型正在经历一次核心范式转移:从对齐人类偏好到对齐任务目标。过去我们追求的是模型‘说得好’,现在要求模型‘做得到’。”周靖人说。

责任编辑:李梦一
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览