从“单点算力”走向“系统算力”  Scale-Up超节点打造国产算力新范式

2025-12-15 18:43:07 来源: 科技日报 点击数:

科技日报记者 崔爽

算力正在成为数字经济时代的“第一资源”。近日,华为发布第六届“十大发明”评选结果,“Scale-Up超大规模超节点算力平台”成功入选。

这一成果被认为突破了传统算力体系中处理器间连接、多维资源协同和算力池化的结构瓶颈,首次将数百、数千个AI处理器连接成一个共享内存池、统一灵活调度、对等协同的整体,让大规模算力真正能够“像一台计算机一样工作、学习、思考、推理”。

在算力需求呈指数级增长、系统效率成为制约AI发展的关键背景下,超节点的出现,被视为从“堆算力”走向“用算力”的重要探索。其背后是系统架构、互联总线、软硬协同等全栈自研能力的融合创新,正在引领AI基础设施发展的新范式。

重构算力组织方式

长期以来,高性能计算和AI训练主要依赖由多个服务器节点组成的集群系统。随着模型规模不断扩大,传统集群架构下节点间通信频繁、调度复杂、效率衰减等问题日益凸显,算力规模越大,系统瓶颈越明显。

这一背景下,超节点应运而生。作为一种新型算力组织形态,它并非简单增加计算卡数量,而是从系统层面对算力、内存和通信关系进行重构。

“你就把它想象成是盖一栋高楼。”被问及如何通俗地解释超节点,发明人代表孙宏伟打了个比方,“假设有一个地方土地面积有限,大家自然会想到把楼盖高,这便是Scale up。” Scale-up超节点就是这样一幢“高楼”。作为Scale Up的当前最优解,它通过内部高速总线互连,能够有效支撑并行计算任务,加速卡间参数交换和数据同步。

在超节点内部,各类异构算力资源通过高速互联总线实现全对等连接,计算、存储与内存资源被统一抽象、池化管理,根据任务需求灵活组合。

这种“一切皆对等、一切皆可池化、一切皆可组合”的设计,使超节点具备了像搭积木一样灵活配置算力资源的能力,为超大模型的高效运行提供了新的基础设施形态。

从架构到通信的系统创新

支撑Scale-up超节点成立的,是一系列面向系统层的关键技术突破。

首先是全对等互联架构。在传统计算体系中,CPU(中央处理器)往往处于中心位置,其他加速器和资源围绕其工作,容易在规模扩大后形成性能瓶颈。超节点通过对等互联设计,使NPU(神经网络处理器)、CPU、内存等资源处于同等地位,所有计算单元都可通过高速总线直接访问共享内存池,实现跨节点的高效调度。这种设计从根本上改变了算力与内存的关系,为高度依赖数据交换的大模型训练提供了结构性支撑。

当算力规模进一步放大,通信方式成为决定系统效率的关键因素。

传统集群节点间通信需经过复杂网络协议,存在时延高、开销大的痛点。Scale-Up超节点通过内存语义通信技术,可直接访问对端NPU,大幅提升通信效率,从根本上解决了大规模计算中节点协同的效率瓶颈。华为内存语义通信技术的核心价值,在于将节点间通信转化为类本地内存访问,让数百个昇腾芯片真正融为一体,有效算力利用率的提升对大模型训练周期的缩短起到决定性作用。

如果说架构和通信定义了超节点“能不能成立”,那么工程实现则决定了它“能不能落地”。

随着互联规模扩大,传统电连接方案在带宽、功耗和传输距离上的局限逐渐显现,难以满足跨机架、大规模算力协同的需求。

针对这一挑战,华为超节点方案全面引入光通信,通过光模块和光纤构建新型高速互联通道,实现从芯片到节点的全栈硬件协同。

光互联在大带宽、低时延和远距离传输方面的优势,使超节点在规模扩展的同时,仍能保持稳定的通信性能,为系统整体效率提供保障。卡间通信不再成为性能瓶颈,Scale-Up架构也具备了工程化、规模化部署的现实基础。

目前,昇腾384超节点在算力、互联带宽、内存带宽等方面全面领先。同时,它是业界唯一支持DeepSeekV3/R1在一个超节点域内即可完成所有的专家并行(EP)解决方案,也是业界唯一突破Decode(解码)时延15毫秒的方案。

塑造“超级算力底座”

大模型时代,算力竞争的焦点正从单点性能转向系统效率和可持续扩展能力。Scale-Up超节点通过系统级创新,使模型训练和推理能够在更高效、更稳定的算力环境中完成,为人工智能应用落地提供坚实支撑。

更重要的是,超节点所代表的并非单一产品形态,而是一种算力发展范式的转变。它通过系统工程方法整合芯片、互联和软件能力,探索出一条以系统能力释放算力潜能的发展路径。

业内人士认为,在人工智能向更大模型、更复杂应用持续演进的过程中,这种以系统创新突破物理和工艺约束的思路,将成为提升算力利用效率的重要方向。

如今,从制造、交通、气象到石油化工、生命科学,大模型为核心的数智化转型无所不在。对算力的海量需求,对高效低延迟通信、大规模并行计算能力的迫切要求,将超节点产品的市场需求逐渐推高。 

Scale-up超节点用一系列创新回应了现实需求。它的实践证明,我国算力产业可以通过系统思维突破物理极限,持续打造高效、可靠、可演进的算力基础设施,筑牢人工智能产业高质量发展的底座根基。

责任编辑:李梦一
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览