科技日报记者 刘侠
技术架构可降低20%建设成本、提升30%并行效率、减少90%运维点位……记者4月16日从中物院成都科学技术发展中心(以下简称“成都科技中心”)了解到,由该中心自主研发、曾在2025年中国算力平台与应用大会(第三届)上首次发布的“星河超算”系统,目前已在国家超算成都中心、四川长虹、西南科技大学等实现广泛运行,成功实现“国产无盘超算”多领域应用突破。
传统超算系统构架包括计算网络、存储网络和管理网络等,在超算运行中类似于“高速公路”“快速通道”“城镇道路”,它们彼此通过不同协议进行互通。而新型的“星河超算”系统则基于单层RDMA(远程直接内存访问)网络无盘超算技术,将上述三者采用统一协议进行交互,提升超算系统的运行效率。

“此前业内广泛采用国外超算系统内核与架构,对‘国产无盘超算’存有疑虑。”成都科技中心四室主任、“星河超算”系统研发团队负责人刘晓毅说,为打破这一“瓶颈”,从2011年开始,团队成员独立研发了基于千兆以太网的无盘超算技术,实现系统内核信息协议优化,并进一步自主研发内核模块、计算协议互通优化模块,最终在不影响传统开发者和用户计算环境的条件下,实现了单层RDMA(远程直接内存访问)网络无盘超算。经实测,开源和商业程序在“星河超算”系统上均可观察到以单节点为基准、千核级强扩展并行效率超100%的超线性加速。
从2025年起,“星河超算”取得第一个商业订单后,目前已向全国20余家单位提供技术服务,逐步形成从场地设计、硬件选型、超算环境到管理系统部署的全栈解决方案能力。目前,成都科技中心与西南交通大学材料学院合作建设了“星河”二号超算集群,与国家超算成都中心合作共建全国产处理器和加速卡异构计算的“云河”超算集群,大幅提升国产超算硬件并行计算效率;与西南科技大学合作共建“山河”超算集群支撑其教学科研工作的超算需求;向中国电建、浙江大学、四川大学、河海大学等国内企业和科研院所提供超算机时和计算仿真服务。
针对长虹集团推进“智改数转”过程中,产品研发过程中的多领域工程计算需求受困于算力短板。成都科技中心承建了长虹集团智慧仿真中心(“虹河”集群),节省20%硬件成本与90%运维点位,内核级重构实现系统调用兼容,可直接适配多生态专业软件。
“成都科技中心以‘三中心、一平台’为核心,将企业需求转化为标准任务、集中管控数据、提供弹性算力,并链接外部科研力量破瓶颈,平台硬件国产化率超95%。”刘晓毅说,目前已支撑长虹多个子公司仿真任务,计算周期缩短三分之二、计算成本降低70%;技术上,相同硬件运行同一仿真算例,10节点并行效率从47%升至86%,计算速度提升80%、能耗降低45%。作为智能制造“算力+生态+协同”的典型实践,在2025年中国算力平台与应用大会发布后获业内广泛关注。
据了解,除系统底层技术外,成都科技中心还研发了适用于工程科学计算的前端程序,正在全国各大超算中心、高校和企业得到应用。

网友评论