科技日报记者 龙跃梅
4月3日,由中国电信广东公司联合阿里云共同建设的粤港澳大湾区首个基于“真武”芯片的万卡智算集群,在韶关数据中心集群正式上线。作为国家“超大规模智算集群”新基建在大湾区的首个落地项目,该集群实现了从芯片、云平台到模型应用的全链路自主研发,标志着自研先进算力正从高端性能突破加速迈向产业应用与算力普惠。

该集群在技术层面实现了多项关键突破。通过卡间RoCE高性能组网、双平面多轨通信等技术创新,集群端到端网络时延低至4微秒,网络峰值利用率超过95%,能够高效满足大模型训练过程中AllReduce、AlltoAll等超大流量通信需求,稳定承载千亿参数级大模型的预训练与推理任务。真武芯片整机提供1.5T大显存,卡间互联带宽超过700GB/s,为国产算力底座提供了坚实支撑。
在行业应用方面,集群已面向政务治理、医疗民生、新兴产业等领域提供算力及应用解决方案。在城市治理领域,集群为城市管理与公共安全等场景提供算力底座及“超级搜图”应用,显著提升海量图片与视频数据的检索效率。在医疗民生领域,上线“全诊通”应用,面向基层医疗机构提供诊疗智能化服务,已在中山大学肿瘤防治中心等医院开展国产化迁移与应用试点。在产业创新领域,集群为电子信息、先进材料、生物医药、装备制造、低空经济等新型产业提供模型训练、推理与调优服务,助力企业加速研发迭代与智能化升级,有效缩短创新周期。
算力普惠是此次集群上线的核心亮点。凭借集群规模优势,与芯片-算力云平台-模型架构的全栈自研和深度协同的技术优势,相较传统单机部署模式,“真武”智算集群的单卡吞吐性能提升9.3倍,每秒Token生成总量提升近10倍,每百万Token的算力成本同比大幅下降。同时,其支持DeepSeek-V3.2满血版、Qwen3.5-397A-A17b等业内领先开源模型可实现单机快速部署。在生态兼容方面,“真武”芯片全面适配主流AI生态,自研软件栈高效适配各类主流模型、框架、算子库及操作系统,具备统一的编程接口,可端到端支持用户自主业务落地与扩展,大幅降低客户迁移成本。
作为粤港澳大湾区枢纽核心引擎,韶关数据中心集群目前已建成可承载15万标准机架及22万P算力的能力,同步建成400G低时延全光运力网络,全域覆盖粤港澳大湾区,精准构筑1-3-5-10毫秒分级时延圈——城市内1ms、大湾区3ms、省内5ms、华南区域10ms,全面实现算力跨域高速智能互联,筑牢区域一体化算力调度传输根基。
(主办方供图)

网友评论