全国首个高质量人工智能治理科技语料发布

2025-07-28 22:01:35 来源: 科技日报 点击数:

科技日报记者 付丽丽

7月28日,东壁科技数据有限公司(以下简称“东壁科技数据”)联合上海财经大学数字经济学院共同构建的全国首个高质量人工智能治理科技语料与首个人工智能多元共治决策支持大模型,在2025世界人工智能大会大模型治理和有序发展生态论坛正式发布,标志着我国在探索科学高效、多方协同的人工智能治理模式方面迈出了坚实一步,为人工智能协同治理提供了关键的科技支撑。

当前,以人工智能为代表的新一轮科技革命和产业变革正在深刻重塑世界格局与人类生活。人工智能技术的快速演进也带来了复杂的新挑战与新课题,数据安全、算法偏见、伦理失范、就业冲击等问题日益凸显。

注重共同治理,已成为人工智能有序发展的重要行业共识。《人工智能全球治理行动计划》明确指出,开展人工智能安全治理应及时开展人工智能风险研判,提出针对性防范应对措施,构建具有广泛共识的安全治理框架。上海浦东新区数字化转型专家委员会委员、上海财经大学数字经济学院院长赵琳表示,在此背景下,上海财经大学数字经济学院与东壁科技数据开展合作,致力于构建人工智能治理领域关键科技基础设施,以响应国家号召并应对人工智能治理挑战。

东壁科技数据创始人、深圳大学特聘教授吴登生表示,东壁科技数据依托其拥有中国自主知识产权的高质量科技文献数据库平台,聚焦人工智能治理的核心挑战,围绕后门攻击、数据投毒、逆向攻击、黑箱问题、过拟合或欠拟合、对抗样本攻击、就业替代等14类人工智能治理风险,构建了国内首个高质量人工智能治理科技语料库。该科技语料库共采集了人工智能治理领域500余篇高质量英文期刊论文、1500余篇核心中文期刊论文,整合了来自相关部门发布的人工智能治理相关法律法规、政策文件、技术标准、典型案例等高质量规范性文本1000余份。经过严格的人工精细标注、深度结构化处理以及多重质量筛选,最终沉淀出一批高度结构化、主题明确、内容权威的标注语料。“这一覆盖学术前沿与政策实践的多维科技语料,为推进我国人工智能协同治理工具的研发提供了关键数据支撑。”他说。

上海金融科技产业联盟智慧金融专业委员会委员、上海财经大学数字经济学院副院长肖升生在发布现场介绍,在人工智能治理科技语料的基础上,上海财经大学数字经济学院与东壁科技数据联合开发了全国首个人工智能多元共治决策支持大模型,为人工智能协同治理提供关键工具支撑。

该模型专注于人工智能治理领域知识问答、案例查询与分析、技术方案咨询、治理方案生成、资源查找五大核心任务,在国产开源大语言模型基础上,利用构建的2000多条高质量人工智能治理领域问答对语料进行精细化的微调,使其回答能够严格遵循人工智能治理领域回答范式。除此之外,该模型还接入了基于前述人工智能治理科技语料库构建的可持续动态更新数据库,通过检索增强生成(RAG)技术,模型能够有效引用权威语料库内容,大幅提升了专业回答的准确性和可靠性,显著缓解了通用模型在此领域易产生“幻觉”的风险。在构建的1000条人工智能治理领域测试集中,模型回答准确率达到91.4%,幻觉产生率仅1.5%,这一性能表现表明该模型在人工智能治理专业领域已达到较高实用水平。

未来,东壁科技数据与上海财经大学数字经济学院将持续更新人工智能治理科技语料库,并计划将人工智能多元共治决策支持大模型面向有需求的企业和政府部门逐步开放使用,助力各方提升人工智能治理能力,共同推动我国人工智能产业健康、安全、有序发展。

(图片均由主办方提供)

责任编辑:陈可轩

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览