首款全流程国产化类脑脉冲大模型问世

2025-09-08 12:51:20 来源: 科技日报 点击数:

科技日报记者 陆成宽

记者8日从中国科学院自动化研究所获悉,来自该所等单位的科研人员,首次在国产GPU算力平台上,完成原生类脑脉冲大模型“瞬悉”1.0的全流程训练和推理,并正式开源了70亿参数版本大模型,同时开放了760亿参数版本大模型的测试网址。这是全球首款类脑脉冲大模型,实现了全流程国产化,标志着我国在类脑计算与大模型融合创新方面取得重要突破。

当前,基于Transformer架构的大模型主要依赖简单“点神经元”与大规模算力提升智能,但其训练和推理成本随文本长度急剧增加,严重制约超长文本处理能力的提升。

在这项研究中,研究团队另辟蹊径,借鉴大脑神经元的工作机制,提出了一种新的“基于内生复杂性”的具有线性复杂度的类脑脉冲大模型架构,成功打造出“瞬悉”1.0。“这个模型不仅在理论上揭示了新型计算路径,还构建了适配国产算力的训练推理框架,为构建更高效、更复杂且性能更强的新型大模型开辟了新路径。”中国科学院自动化研究所研究员李国齐说。

相比传统模型,“瞬悉”1.0展现出四大核心优势:首先,在极低数据量下实现了高效训练,显著提升了长序列训练效率;其次,推理效率得到数量级提升,特别是在超长序列处理上展现出显著优势;再次,构建了国产自主可控的类脑大模型生态,支持将现有Transformer模型高效转换为类脑脉冲架构;最后,设计了多尺度稀疏机制,为低功耗的类脑大模型运行提供了有力支撑。

李国齐表示,这项成果不仅是我国在类脑脉冲大模型架构和国产算力全流程建设上的重大突破,更为法律、医疗、科学模拟等超长序列应用场景提供了更高效的建模工具,也将启迪下一代神经形态计算理论和芯片设计。

(中国科学院自动化研究所供图)

责任编辑:李梦一
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览