来自人脑与人工智能模型的双重证据显示:语言可影响视觉

2025-12-15 19:47:13 来源: 科技日报 点击数:

科技日报记者 杨雪

近日,北京大学联合北京师范大学、山西医科大学第一医院的研究团队发现,语言不仅塑造思维,也可能在潜移默化中改变人们“看世界”的方式。相关研究成果12月15日发表在国际期刊《自然·人类行为》上。

语言会不会影响感知?这是心理学、语言学乃至哲学中争论了一个多世纪的问题,也是人对自身研究的核心问题之一。支持者认为,语言为人类划定了理解世界的边界——有什么词就看见什么;反对者则认为,视觉、听觉等感知系统独立于语言而运行,不受其影响。这一问题之所以难解,是因为在人类发展中,语言与视觉经验几乎总是同时出现,难以在实验中加以区分。

人工智能的发展为解开这一经典难题带来新的契机。论文通讯作者之一、北京大学心理与认知科学学院与人工智能研究院助理教授朱毅鑫介绍:AI模型就像一个可控的“数字实验室”,我们可以人为决定它是否学习语言,再观察不同学习经历是否导致“看世界”方式的差异。研究团队比较了两类AI模型:一类只学习过图像(纯视觉模型),另一类同时学习过图像和文字(视觉–语言模型)。随后,将这两类模型的内部表征,与人类大脑视觉皮层在四组健康人群中的活动模式进行比对。

结果显示,视觉–语言模型与人脑视觉皮层的活动模式更为相似,尤其集中在左半球——人类语言加工的主导区域。而且,这一模式在使用手语的聋人中同样存在,说明语言经验——无论是口语还是手语——都在视觉加工中留下系统性的印记。论文共同第一作者、北京大学博士生陈昊扬表示,简单来说,被语言“指导”过的AI视觉模型,看世界的方式更接近人脑。

然而,AI模型与人脑的相似性,并不能直接证明语言在其中起了因果作用。为此,团队将目光转向脑卒中患者。脑卒中常会损伤连接语言区与视觉区的白质纤维通路,为科学家提供了一个“天然对照实验”。研究结果表明:患者语言–视觉通路受损越严重,其视觉脑区活动越像“纯视觉模型”,而越不像“视觉–语言模型”。当语言–视觉通路被破坏,语言对视觉的调节作用随之消失,成为“语言调节视觉”的直接证据。这一现象提示语言与视觉之间的功能联系具有方向性的功能调节,而非仅仅是两者在大脑中同时活跃。论文共同第一作者刘擘和通讯作者之一山西医科大学王效春医生表示,脑损伤患者的数据是无价的,它让我们看到了人脑中语言通过与视觉皮层连接的神经通路调控视觉功能的必要性。

这一跨学科研究展示了人工智能与脑科学相互赋能的新模式。脑损伤患者的参与为模型提供了罕见的因果验证——当大脑的语言–视觉通路被自然“切断”时,AI模型所预测的模式确实出现在人脑之中。论文通讯作者、北京大学心理与认知科学学院及人工智能研究院教授毕彦超表示,用AI模型理解大脑的同时,脑损伤患者的脑活动反过来验证了模型的机制——这让AI与脑科学第一次真正闭合成一个实验循环,形成了脑科学研究的新范式。

AI帮助我们理解大脑,大脑也为未来AI的前沿探索与发展提供了方向。“我们发现语言在大脑视觉系统中扮演了组织和调节的角色,这启发我们思考,真正的智能也许需要像人脑一样,让语言去统筹感知、记忆和推理,而不是简单地并列处理多种模态。”朱毅鑫说。

(受访者供图)

责任编辑:李梦一
网友评论
最热评论
没有更多评论了

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览