数据标注让AI更懂“人心”——江苏太仓智汇谷抢占人工智能产业发展关键身位

2025-07-23 14:47:09 来源: 科技日报 点击数:

科技日报记者 张晔 实习生 刘雨辰

7月14日,德国弗劳恩霍夫协会专家团队一行,到访江苏太仓智汇谷·科技创新园,与20余家本地企业在智能制造、新材料等领域交流合作。

作为一家建成仅一年多的苏南小县科技园区,太仓智汇谷赢得国际顶尖科研机构青睐的背后,是其结合产业基础与科教资源,聚焦数字经济等产业赛道的精准发力。

竞逐人工智能产业新赛道,把握人工智能驱动产业升级新机遇。目前,蚂蚁数科AI数据产业基地在太仓智汇谷落地,打造的“AI数据标注平台”,已成功入选全国首批数据标注优秀案例,并应用于自动驾驶、互联网、金融等场景,解决了AI落地“最后一公里”的数据适配问题。

锚定数据与具身智能“双引擎”

科技创新的谋划是对城市发展未来坐标的一种瞄准和聚焦。

在AI产业狂飙突进的时代,数据作为人工智能三大基石之一,其关键环节——高质量数据标注,被视作模型训练迭代的“源头活水”。

近年来,太仓引入了蚂蚁数科在长三角建立的首个AI数据产业基地,通过构建高质量数据经济、推动产学研协同、以技术深度赋能产业三个维度,把数据基础能力转化为区域发展的先发优势。

“高质量数据集是通往AGI(通用人工智能)的关键条件,”蚂蚁数科AI科技运营负责人贺翔云告诉记者,这里处理的不仅是简单的数据,更是驱动大模型认知世界的“启蒙教材”。

位于太仓的江苏云幕智造科技有限公司内,一款名为“小雪”的接待引导机器人,面对迎来送往的宾客表现自如、讲解出色,引得众人围观。

云幕智造是国内首批具备仿真皮肤人形机器人量产能力的企业之一,像“小雪”这样的文旅场景智能讲解人形机器人,已开发出40多款IP形象,并入选江苏省“十大典型应用场景”,预计今年的销售额将实现指数级增长。

具身智能作为人工智能与机器人技术的深度融合产物,而数据标注是人工智能算法得以有效运行的关键环节。为了帮助具身智能系统精确理解物理世界,必须依靠数据标注师逐帧分析动作视频,构建机器人“动作图谱”,通过持续优化数据标签,让具身智能机器人更聪慧。

“能清晰看到AI系统理解和执行能力的提升,参与感很强。”蚂蚁数科标注师赵秋燕说。

数据标注与具身智能的双轨并进,正驱动太仓人工智能产业高速发展。目前,全市已集聚近150家相关企业,产业规模超200亿元。依托《太仓市“人工智能+”创新发展行动方案(2025—2027年)》的政策引领以及蚂蚁数科生态集群、云幕智造等领军企业,太仓构建了“技术攻关—数据支撑—场景落地”的AI产业闭环生态,在新一轮科技革命和产业变革中抢占了发展新质生产力的关键身位。

公共技术底座驱动产业跃升

太仓智汇谷·科技创新园是苏州市首批“人工智能+”产业园,为了多维度支持落户企业发展,园区通过政策扶持和公共技术平台打造全方位服务。

蚂蚁数科AI数据产业基地,不仅是蚂蚁集团人工智能大模型研发的核心数据基础设施,也是长三角AI产业的公共技术底座,为制造、金融、医疗等行业领域的垂直大模型提供高精度、场景化的训练数据支撑。

前几年,AI标注工作还是数据的基础分类与打标,如今,标注师需要处理复杂任务,融入逻辑判断与领域知识。以自动驾驶、具身智能等场景经常用到的4D标注为例,要求标注师在动态点云数据中识别目标,并完成三维空间推理——例如通过局部点云数据还原车辆轮胎、车头等缺失部件,确保标注的空间完整性与毫米级精度。“这需要极强的空间想象力和专业训练。”蚂蚁数科AI科技运营负责人贺翔云说道。

目前,蚂蚁数科的AI标注已经深入数十个产业,在通用模型、内容审核模型、金融模型、自动驾驶、智能客服等多个垂直领域的大模型中,把控数据质量,评测模型准确性,助力算法训练与优化。

“我们已吸引一批生态链企业在此聚集,并将逐步形成以蚂蚁为核心的人工智能产业集群。”贺翔云介绍。

太仓智汇谷建成一年多来,深耕航空航天、新能源汽车、数字经济三大产业赛道,入驻科创项目超70个,集聚科技人才超千人。西北工业大学太仓智汇港、西交利物浦大学太仓校区通过搭建各类产学研融合平台,成为太仓科创策源地。

(受访者供图)

责任编辑:陈可轩

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览