已建高质量数据集超过3.5万个 我国算力总规模位于全球第二

2025-08-14 18:16:56 来源: 科技日报 点击数:

科技日报记者 吴叶凡

14日,国新办举行新闻发布会,介绍“十四五”时期数字中国建设发展成就。国家发展改革委党组成员、国家数据局局长刘烈宏介绍,截至2025年6月底,我国算力总规模位于全球第二,已经建设高质量数据集超过3.5万个,总体量超过了400PB。

刘烈宏指出,“十四五”时期,我国牢牢把握数字化、网络化、智能化发展机遇,全面深化数据要素市场化配置改革,推动数字中国建设取得显著成就。近年来,我国人工智能的快速发展,就离不开国家对数据工作的高度重视。

“数据是人工智能发展的三大核心要素之一,在推动‘人工智能+’过程中发挥着关键作用,特别是高质量数据集的建设至关重要。”刘烈宏举例,在医疗健康领域,通过标注的医学影像高质量数据集,模型的疾病诊断准确率可以提升15%以上。

作为第一个把数据作为生产要素的国家,我国多措并举促进数据资源的开发利用。刘烈宏介绍,为大力推动高质量数据的供给,我国出台了高质量数据集建设相关文件,多部门联合推动相关工作。“我们指导全国数据标准化技术委员会研究制定了相关标准和技术文件,组织了高质量数据集建设先行先试工作和典型案例征集活动,分行业、分领域树立了一批典型的解决方案。”刘烈宏说。

刘烈宏透露,经过一段时间的努力,国内多数模型训练使用的中文数据占比已经超过了60%,有的模型已达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能的快速提升。

人工智能模型的训练也推动了数据交易需求的攀升。数据显示,截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数据集总规模达到了246PB。“以北京数交所为例,高质量数据集占交易总量的比例从去年的10%跃升到目前的近80%。”刘烈宏说。同时,上海、天津、安徽等地正在试点“数据语料作价入股”等新模式,引导企业将高质量数据集折算为股权投入到相关企业。

刘烈宏表示,下一步,相关部门将通过体系化布局持续推进高质量数据集建设,加快打造具身智能、低空经济、生物制造等重点领域数据高地。“我们也将推动全社会强化数据要素价值认同,加快推进数据要素价值共创,培育‘为优质数据买单’的市场共识。”

责任编辑:李梦一

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览