科技日报记者 罗云鹏
6月13日,在德国汉堡举行的国际超级计算大会2025公布了新一期系统数据吞吐能力IO500排行榜,“鹏城云脑Ⅱ”连续第十次斩获总冠军。
“鹏城云脑Ⅱ”自2020年10月正式上线运行以来,在2020年美国超算大会(SC20)和中国超算大会期间,首次亮相便一举夺得IO500总排行榜、10节点排行榜两项冠军以及AIPerf500的世界冠军,引发国内外广泛关注。
据悉,“鹏城云脑Ⅱ”采用对国产自主软硬件高度优化的SuperFS新一代大规模分布式文件系统,针对海量训练数据访问带宽瓶颈,提出了分布式高性能存储缓存架构,利用计算节点内高带宽闪存与高性能网络,以及去中心化设计,实现数据全分散存储并提供全局视图,通过直通式数据传输等技术极大提升了数据存取性能。
此外,“鹏城云脑Ⅱ”还针对文件数据访问延迟高的问题,提出了内核旁路技术,结合RDMA网络降低延迟,利用协程机制设计高并发任务调度,并行文件系统的访问带宽达4.8TB/s,消除了AI大模型训练过程中的文件读写瓶颈,IO500得分达到了210255,排名世界第一,表明其软硬件联合优化的潜力巨大。
另悉,“鹏城云脑Ⅱ”问世以来,已助力多个领域实现科研创新模式的变革。在大模型研究中,其强大的数据处理能力为模型训练提供了高效的数据支持,加速了模型的优化与迭代;在天气预测领域,能够快速处理海量气象数据,显著提高预测的准确性和时效性;在分子动力学、药物研发、基因分析等生命科学领域,也为相关研究提供了有力的数据处理保障,推动科学研究的深入开展。