杨 锋
习近平总书记在中共中央政治局第二十次集体学习时指出,人工智能作为引领新一轮科技革命和产业变革的战略性技术,深刻改变人类生产生活方式。他进一步强调,以人工智能引领科研范式变革,加速各领域科技创新突破。这一系列讲话为社会科学顺应人工智能浪潮、拓展研究路径提供了重要指引。
近年来,人工智能尤其是以大语言模型为代表的生成式人工智能,正以前所未有的速度深刻改变社会生活的方方面面。对于社会科学研究而言,这不仅意味着研究工具的迭代,也进一步丰富了研究议题与研究对象。
人工智能重塑社会科学研究方法
近年来,大语言模型逐渐被引入社会科学研究方法体系。凭借对自然语言与人类行为的模拟能力,这类工具不仅可降低研究成本,还拓展了研究的方法边界。整体来看,人工智能正成为一种可嵌入式的研究辅助系统,能在多个环节实现自动化与高效化,特别是在文本处理、数据生成与模拟实验三个方面,突破了传统工具在规模化、数据可得性与交互复杂度上的限制。
第一,在文本分析方面,大语言模型凭借其强大的语境理解能力,在执行情感识别、立场判断与话语倾向分析等任务时,明显优于传统依赖关键词匹配和词频统计的方法。随着社交媒体与新闻平台持续生成海量文本数据,学界对自动化、规模化处理文本数据的需求不断上升。而大语言模型在文本标注、情绪判断与信息抽取等任务中,准确率接近人工编码水平,并展现出较强的通用性与适应能力。
第二,在合成调查数据方面,大语言模型可根据特定身份特征(如年龄、教育水平等),模拟受访者作答,从而生成合成数据。该方法响应快、成本低,在社会调查成本上升、回应率下降背景下,提供了一种具有前景的替代性调查手段。特别是随着“算法保真度”等用于评估合成数据质量的标准不断提出与发展,大语言模型可控性与实际应用价值正在逐步提升。合成数据的重要应用场景是对已有社会调查中的缺失值进行插补。大语言模型可在保留原始数据基础上,依据已知变量预测并填补缺失项,并借助明确指标评估其准确性与稳定性,为研究者提供传统方法之外的可行工具。
第三,生成式人工智能为模拟人类复杂互动过程提供了新途径,有助于揭示社会规范的自然演化机制。传统调查虽能捕捉个体态度与行为,却难以系统观察密集互动下的动态变化,进而难以理解未经设计的社会行为如何自发涌现。基于生成式代理的社会模拟为此类研究提供了低成本、高可控、可重复的虚拟实验平台,使研究者能在设定情境下观察行为互动,探索社会规范的生成逻辑。例如,斯坦福大学与谷歌合作开发的“虚拟小镇”项目中,25位生成式代理人能在同一虚拟空间中沟通、协作。在一项实验中,研究者仅向一名生成式代理人植入“想举办情人节派对”的想法,代理人之间随即展开信息传播、协调并成功举办活动,在没有预设剧本的前提下展现了集体行动如何在自由互动中自然生成。目前,国内研究机构也在探索“社会模拟器”的构建,利用生成式人工智能模拟群体行为,以揭示社会行为的结构性动力。
尽管大语言模型在文本分析、合成调查数据与模拟社会互动等方面展现出广阔的应用前景,但目前其实际应用仍处于起步阶段,尚未形成广泛、规范的研究实践。其运作机制高度复杂且缺乏透明度,体现出典型的“黑箱”特征,有悖于社会科学对研究工具可解释性和过程透明性的基本要求。此外,该类技术对提示词的设计高度敏感,输出结果存在一定不稳定性,且模型持续迭代更新也进一步削弱了结果的再现性,从而对研究的可复制性和可验证性提出挑战。因此,在拓展人工智能在社会科学中的方法价值的同时,也有必要同步推进对其“黑箱”机制、输出一致性与可靠性的系统研究与规范建设。
人工智能拓展社会科学研究议题
随着人工智能在各类场景中的广泛应用,围绕其治理方式的讨论已成为公共政策与全球治理中的核心议题。社会科学研究者围绕制度设计、伦理边界、安全审查与责任机制等问题,展开了理论探讨与政策建构。
除了“如何治理人工智能”的议题,人工智能作为一种通用技术,其广泛部署对国际格局、国内社会结构、经济发展模式及社会心理状态等方面也产生了深远影响。这些影响也逐渐成为社会科学研究的重要议题。例如,人工智能技术的推广在短期内可能引发对新工具的焦虑;从全球视角看,人工智能有可能进一步加深人工智能技术弱国对技术强国的依赖;在国内,则可能重塑职业结构,并改变代际流动的路径与机制。
当前人工智能仍处于快速演进的早期阶段,学界对其影响的研究多集中于短期效应或基于理论模型的前瞻性推演,其长期影响及深层机制仍有待进一步观察与实证检验。
值得关注的是,人工智能的发展也引发了一系列反思。大语言模型在应用中暴露出诸多社会偏见与认知失衡问题。例如,其对低教育群体、发展中国家和边缘语言环境的理解存在系统性偏误。这些偏误一方面需通过扩充数据、优化模型等手段加以修正,以便更好地使其作为研究工具广泛应用;另一方面,也为社会科学提供了反思人类潜在偏见的新窗口。模型所呈现的偏见,或许能帮助我们识别那些在现实中因社会压力或政治规训而不易显现的认知倾向,并进一步追溯其深层根源。
笔者团队基于跨国调查数据,评估主流模型对不同国家与社会群体主观感知的模拟能力后发现,主流模型在预测低教育群体和发展中国家时误差显著。研究还发现国产模型在理解中国语境方面表现更优。上述偏误并非偶发,而是源于训练语料在地理分布、文化偏向和价值设定上的结构性失衡,致使模型在面对“非西方世界”时易陷入刻板印象和认知盲区。因此,人工智能并非中性的认知工具,而是一种嵌入特定社会语境与文化背景的技术产物,需要社会科学从理论层面予以解构与反思。
总体而言,人工智能既是社会科学的研究工具也是研究方向,对社会科学产生了深刻而复杂的影响。我国人工智能居于世界领先地位,这不仅是我国科技发展的机遇,也为我国社会科学研究开辟了新空间。社会科学领域应主动回应,既警惕技术决定论,也避免工具恐慌,在人工智能的使用中完善方法,在反思中提升对人工智能的认识。
(作者系北京大学光华管理学院社会研究中心研究员)