国内首个通过人机辩论图灵测试的大模型在上海诞生

2025-07-29 18:37:22 来源: 科技日报点击数：

冯妍科技日报记者王春

“如果能一键消除所有痛苦回忆，要不要按？”大屏幕上，两名服装、长相一模一样的辩手对这个涉及情感、伦理、心理学、哲学等的论题展开激烈辩论。这背后，一方是真人辩手武汉大学教师陈铭，另一方则是上海企业MiniMax提供的大模型。在7月26日举办的“2025中国·AI盛典”的辩论赛赛后投票中，42%的观众把大模型认作是人类，这表示大模型已经通过了人机辩论的图灵测试。

图灵测试是衡量机器是否具备人类智能水平的经典标准，由被誉为“人工智能之父”的图灵在1950年提出：如果一台机器在自然语言对话的过程中能“骗过”超过30%的人类参与者，那么就可以被视作具有智能。

这是国内大模型首次通过人机辩论图灵测试，不仅标志着我国在AI自然语言理解和逻辑思维方面取得重大进展，更展现了上海作为全球人工智能高地的创新实力。据了解，这位“辩手”的文本大模型学习了万亿条人类数据，而其语音大模型仅需6秒声音片段即能模拟真实人声。辩论影像则由节目组运用AI技术统一处理，100位观众仅凭辩论内容、语言风格和思维逻辑判断谁是人类。

在辩论中，模型表现亮点众多。如在论点构建中，针对“人工智能是否应拥有法律人格”等辩题，模型能快速检索法律条文、伦理案例，构建多层次论证框架；在临场应变时，面对人类辩手的即兴诘问，模型半秒内即可生成反驳话术，例如在“技术失业”议题中能结合制造业自动化数据提出“岗位结构转型”新视角；在情感渲染方面，模型通过语音合成技术模拟语气变化，在“教育公平”辩论中以富有感染力的叙述引发观众共鸣。

赛后，曾多次获得国际辩论赛冠军的陈铭发微博称：“对于推理能力的成熟程度，辩论几乎是最佳试金石。以我这次的亲身体验来看，经过针对性训练的推理大模型，辩论能力恐已超过90%的人类辩手。观点、逻辑、梗、金句、上价值，再加上极富感染力的输出，AI流畅无比，信手拈来，在语言技术上人类几乎已经没有什么自留地了。”同时，他也认为AI尚未完美，“最后的荣耀，还是在那些‘大’问题的深度思考上。对于根本性哲学思考的观点突围，AI仍力有不逮。”

上海交通大学人工智能学院院长李颉指出，该模型在辩论场景的突破为政务咨询、金融谈判等强交互领域提供了新范式。目前，MiniMax已与复旦大学合作，将相关技术应用于科技伦理审查智能体系统“一鉴”，实现伦理风险自动标注与合规性分析。

中国工程院院士、之江实验室主任王坚认为，这场图灵测试的意义，早已超越了简单的“辨别人机”。他表示：“当年的图灵测试为人工智能定了一个极具挑战的目标，今天我们看到，通过图灵测试只是人工智能的下一个新的开始。”

责任编辑：孙莹

国内首个通过人机辩论图灵测试的大模型在上海诞生

友情链接

抱歉，您使用的浏览器版本过低或开启了浏览器兼容模式，这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级，继续浏览