本报讯(许晓鸣记者刘传书)截至7月,深圳华大基因研究院超级计算机集群的计算峰值已达8万亿次每秒,存储能力达到670T,这为我国在基因组科学研究跻身世界前列提供了重要保证。
据介绍,该集群针对基因组学海量数据特点,全面采用新一代Intel至强4核处理器和开源的64位Linux操作系统,配合华大自主开发的面向新一代测序技术的管理和计算软件搭建而成。该集群每天能处理6T的基因组数据,相当于每天能存储、分析3个人的基因组数据。同时,深圳华大基因研究院还和Intel合作,打造更加绿色节能的高性能计算机,每万亿次的功耗仅为8千瓦,比以前的大型计算设备降低了近10倍。
据悉,该超级计算机集群已完成了炎黄1号的数据处理和分析的任务,目前正在处理炎黄99的数据,同时承担起大量国际合作科研项目的数据处理和计算任务,其中包括国际合作千人基因组项目,大熊猫基因组项目,生命之树项目和欧盟MetaHit肠道元基因组项目等。
早在2005年,华大基因就开始了生物信息高性能计算集群的研究。2007年初,深圳华大基因研究院启动炎黄1号项目的研究,同时开始了超级计算机集群的建设,6月中投入使用,计算峰值达1.5万亿次每秒,存储达100T。随着炎黄项目进入最后的攻坚阶段,计算峰值提高到4.5万亿次每秒,存储规模达到300T。今年4月,熊猫基因组和国际千人基因组项目的启动,深圳华大基因研究院的计算和存储告急,7月初三期超算建设完成并正式投入使用,计算峰值达8万亿次。
华大基因专家介绍,随着生命之树项目和欧盟MetaHit等国际合作项目的启动,还将打造一套计算峰值达20万亿次每秒,存储规模达1P的超级计算机集群,继续为世界前沿基因组科学研究“计算到底”。