科技日报记者 杨雪
4月21日,商务部副部长兼国际贸易谈判副代表凌激在介绍《加快推进服务业扩大开放综合试点工作方案》时谈到,鼓励发展数据标注产业,健全数据交易市场体系,支持发展“来数加工”等新业态和新模式。
“数据标注,就是对未经处理的数据添加说明、标记、解释、分类或编码的过程,是提升人工智能算法、模型核心能力的关键环节。”中国信息通信研究院副院长魏亮认为,数据标注是连接数据资源、算法模型与实际应用场景的关键桥梁,是挖掘数据要素价值的关键环节,是人工智能高质量数据集的核心生产力。
去年年底,国家发展改革委、国家数据局等4部门联合印发《关于促进数据标注产业高质量发展的实施意见》(以下简称《实施意见》)。在魏亮看来,《实施意见》从服务国家战略的角度提出数据标注产业——对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。数据标注产业通过数据治理各环节协同发展,带动数据要素产业的持续健康发展,并奠定人工智能产业发展的坚实基础。
数据标注贯穿算法训练、模型评估、迭代优化以及场景应用等多个环节。魏亮认为,发展数据标注产业具有三方面意义:一是有利于充分释放数据要素价值,经过标注处理的数据,具有更高的商业价值和应用潜力,能够被有效交易和流通。二是有利于支撑人工智能能力水平提升,数据标注过程为模型学习的数据打上人类知识标签,然后让计算机不断地学习这些数据的特征,最终实现计算机能够自主识别,建立对现实世界环境和条件的理解。三是有利于人工智能赋能行业应用,数据标注为自动驾驶、智能家居、精准医疗等现代智能化应用提供精准、可操作的数据输入,使得人工智能能够更好地理解和处理复杂场景和任务。
“来数加工”,是把来自国外的原始数据,通过治理、聚合、建模等加工程序,转化为有序的数据产品。它借鉴了传统国际贸易中的“来料加工”概念,只是对象从实体货物转变为数据要素,是一种新兴的跨境数据处理服务模式。
记者从中国信息通信研究院云计算与大数据研究所了解到,来数加工强调的是提供技术能力,把加工外来数据作为一种技术业态。
2024年,全国首个数字保税区落户海南儋州。作为数字保税区内的链主企业和首家落户企业,桉菏(海南)数产控股有限公司及其下属的洋浦数贸港服务有限公司,完成了来自意大利、英国、美国、加拿大等国家共17笔工业数据加工订单,利润超2000万元。
桉菏数产首席科学家宋鹏程介绍,除了工业数据加工,今年他们还将增加关贸数据、AI交易算法数据等领域业务。关贸数据加工,相当于将零散的海关、船运数据整理加工成一个“关贸大脑”,购买该产品的国内外贸易公司就可以提前了解到各地订单量和需求量,有助于贸易公司抢占全球跨境电商的订单。