科技日报记者 崔爽
人工智能浪潮席卷全球,算力需求激增,机房基础设施面临前所未有的挑战。如何构建新一代AIDC(算力基础设施),为人工智能产业提出更强大的基础支撑,已成为产业共同面对的核心命题。
聚焦AIDC机房基础设施建设进程,近日,由全球计算联盟(GCC)主办,中国电子技术标准化研究院和中国电子工程设计院协办的首届“AIDC产业发展大会”在上海举行。大会以“释放澎湃算力,开启AIDC新纪元”为主题,会上预发布《AIDC基础设施规范》,为未来几年AIDC建设提供参考,推动产业高质量发展。
液冷数据中心正成为AIDC必然选择
“人工智能技术深入各行各业,算力需求呈爆发式增长,也对数据中心基础设施提出全新的挑战。”全球计算联盟(GCC)理事长、华中科技大学教授金海开门见山地指出,“随着算力密度与机房功率密度同步跃升,我们正在面临‘热、电、空间’等多重考验。”
如其所言,AI算力设施加速向高密度、液冷化、集群化方向演进,带来更高的功率负载和更复杂的散热要求,也对传统数据中心的供配电系统、建筑结构和网络设计提出新的要求。
“AIDC是智算时代关键基础设施,随着AI算力规模与芯片功率的快速提升,液冷数据中心正成为AIDC的必然选择。”华为董事、ICT BG CEO杨超斌表示。
相比传统风冷数据中心,液冷数据中心能有效降低能源消耗比。其采用的液冷技术通过液体流动或相变带走热量,具有更高的传热量和热流密度,实现更高的散热效率,且能支持更高的部署密度,实现集约高效部署。
“在企业级数据中心里,通常是几台服务器、几百个处理器的规模,且较难部署液冷机房,因此企业运用风冷技术就能解决部分的散热问题。但AI数据中心通常运行几千、几万个处理器,未来可能是几十万个的处理器,因此必须通过液冷解决散热问题。”杨超斌进一步解释,和风冷相比,液冷在能源利用率和机房利用率上,都具备显著优势——相对同等功率的风冷机房,液冷机房能源利用率至少提升25%以上、空间利用率至少提升4-8倍。
未来AIDC需整体规范部署
“更值得关注的是,当前AIDC机房基础设施标准尚未完善,建设改造周期漫长,导致出现了‘AI等机房’的行业发展困境。这是关系到产业能否持续健康发展的全局性课题。”金海直言。
中国电子技术标准化研究院副院长陈大纪同样认为,AIDC产业面临着规划、交付、运营等多方面的挑战,产业界需要一个面向新趋势的AIDC标准与规范,在结构、电气、液冷等多方面提出新的技术要求,共同推动AIDC产业健康发展。
“在风冷场景下,服务器和数据中心的产品化与标准化已较为成熟,因此产业链的各个环节能够高效配合,厂商能很快地将风冷服务器组成集群投入工作。但在液冷场景中,产业链的建设和标准化的工作还不够完善,导致厂商购买液冷设备后,通常需要等待半年以上才能让设备投入工作,不仅影响业务上线,也造成算力资源的大量浪费。”杨超斌坦言。
围绕AIDC标准化,秦淮数据设计院院长郭震认为,AIDC全生命周期减碳需综合选址、设计、建设、运营,并面向未来,从高弹性建筑、高效配电/液冷、绿色低碳等方面夯实基础设施。
科大讯飞技术中心算力平台部运营总监张晶提出,AIDC建设需从“部件堆叠”转向“垂直协同、整合优化”,AI大模型发展需要“高密供电、高密散热、绿电节能、快速部署”的新一代算力基础设施。
“在标准化的过程中,需要提前考虑AIDC未来的整体功率分布和单柜诉求,包括供电、散热、承重等诉求,以及与液冷设备紧密相关的小机电系统、周边接口等。”杨超斌表示,“未来的AI数据中心是一个有机整体,需要在各方面都具备相应的规范,以加快AIDC的建设与使用。”
构建标准统一的生态体系
面对AIDC建设的挑战与机遇,产业界不仅积极探索创新路径,更将目光聚焦于实际落地,共同寻求破解发展瓶颈的有效思路。
会上,《AIDC机房参考设计白皮书》(以下简称“白皮书”)正式发布,进一步为行业提供可落地的参考实践。
白皮书系统分析了AI算力硬件设备走向超大集群的趋势,强调散热体系必须兼顾风冷与液冷的灵活适配。特别是液冷方案需要具备高度弹性和稳定性,应对机柜整体功率密度的显著提升。
围绕建筑结构规划,白皮书提出,机房设计必须预留充足的层高和承重余量,以适配不断增重的AI服务器及相关设备,同时保障后续设备更新换代的灵活性。网络布线策略同样关键,需根据未来超大规模AI集群需求提前规划光纤容量与布局,保证带宽和时延指标满足业务增长预期。
AIDC机房不仅代表技术升级,更体现了产业链的深度融合与协同创新。白皮书强调,构建开放共享、标准统一的生态体系,是实现AI算力基础设施持续健康发展的关键。
“我们要加快标准体系建设。通过共建共享,推动AIDC基础设施相关技术标准的制定与完善,为产业规范化、规模化发展奠定坚实基础。”金海提出。他建议,突破关键技术瓶颈,重点推进液冷等创新技术的研发与应用,加强产学研用深度融合,加速创新成果的转化落地,共同攻克“热、电、空间”等关键技术难题,提升基础设施整体效能;构建协同创新生态,打破行业壁垒,促进产业链上下游的深度协作,打造开放、协同、共赢的产业新格局,形成产业发展的强大合力。
中国电子技术标准化研究院高级工程师沈芷月透露,目前GCC已经布局了智能计算、数据中心、机密计算、边缘计算、绿色计算等多个领域的重点标准,目前已发布20项,预计年底将达到30项。