科技日报记者 张晔
东部有海量的数据,西部有富余的算力,如何对全国算力进行统一的感知和调度,解决东数西算工程中“算不了、算不好、算不起”的难题?在8月20日举行的第九届未来网络发展大会上,中国工程院院士、紫金山实验室及江苏省未来网络创新研究院首席科学家刘韵洁介绍,三个院士团队共同参与研制的“全域一体化数算网调度平台”已获成功,在国家未来网络试验设施CENI上实现了“全分布、全要素、全业务”的全域一体化调度能力,可在全国范围内实现数据、算力、模型的跨域调动与分发。
CENI是“十二五”期间重点建设的16个重大科技基础设施之一,也是我国通信与信息领域首个国家重大科技基础设施。刘韵洁介绍,CENI就像专门为数据传输修建的“高铁专线”,不管路上有多少“数据列车”,都能准时、安全、高效地到达目的地。具体来说,在100%网络负载、途经13个省市、跨越1.3万公里、承载1万条确定性业务的情况下,CENI能做到零丢包,时延抖动小于50微秒。
近日,CENI已通过主管部门组织的总体验收,即将迎来国家验收,这表明该项目已从图纸上的规划,变成了实实在在、能够投入使用的网络设施,开始具备为科研、产业等领域提供服务的能力。
CENI已经覆盖了全国40个城市骨干网,为了更好链接算力方和需求方,架起东数西算的桥梁,科研团队基于国家东数西算工程项目,构建了一个包含智算、超算和通算的基础平台,研发了异构、异属、异地的算力和调度技术体系,为用户提供灵活弹性可复用的算法服务,支撑大模型协同训练。
刘韵洁表示,“全域一体化数算网调度平台”建成后可实现2.25Tbps的峰值调度分发速率,企业推理成本可降低50%,微调算效可超过99%,千亿级大模型跨域池化训练算效可达98%。
目前,该调度平台已通过“算力阀/算力猫”等方式实现“入企、入校、入园”,用户只需要点击“一键加速”按钮即可连接全国范围的算力,让使用算力真正像用水和用电一样便宜、便捷。可以有效支撑东数西算、东数西存、协同训练、协同推理等业务场景,服务国家东数西算、人工智能训练场等重大工程。
(受访者供图)