大模型为何难破推理困局？ CNCC2025专家共探计算技术发展新方向

2025-10-24 14:08:11 来源: 科技日报点击数：

科技日报记者朱虹

“在一元二阶逻辑测试中，主流大模型得分接近0分，离通用人工智能的要求还有巨大差距。”10月23日，在哈尔滨开幕的第22届中国计算机大会（CNCC2025）上，华为公司战略研究院院长周红抛出的问题，直指当前人工智能发展的核心痛点。这场以“数智赋能、无限可能”为主题的行业盛会，吸引12011人注册参会、900余名讲者齐聚，不仅呈现计算技术前沿成果，更围绕大模型、智能超算等领域的瓶颈与破局路径展开深度研讨，为数字经济时代计算技术发展锚定方向。

当前，计算技术已进入多领域渗透、多学科融合的爆发期。会上多位专家为我们展现了人工智能的多场景应用，工业领域中，AI助力炼钢高炉温度精准调控，可降低千万级成本；医疗领域，虚拟手术模拟器可替代动物实验、优化手术方案；科研领域，人工智能实现流体计算效率提升1000倍。计算技术正以“数智赋能”重塑生产、生活、科研范式。

然而，技术快速迭代背后，瓶颈问题同样突出。周红指出，当前大模型存在三大核心挑战：认知偏差导致泛化能力弱，“比如仅获取多面体两面信息，几乎无法预测第三面，甚至在学习加法时，未训练过的数值区间就容易出现预测失误”；数据与能源效率极低，人类高质量文本数据或将在2028年用完，而大模型对文本数据的需求比人类实际情况高10万倍甚至更多，能源消耗更是远超人类大脑；在组合爆炸与长程推理上的能力是明显短板，当前大模型擅长局部数据的统计与抽象，却难以处理周期性，以及更加复杂的规律与方法。

针对这些问题，他提出构建“世界模型”的解决方案：当前深度学习依赖数据驱动形成的“经验引擎”存在明显局限，难以支撑复杂场景下的智能需求，因此“世界模型”的核心思路是打破单一技术路径依赖，构建“经验引擎+行动引擎+理念引擎”三引擎协同体系。其中，“经验引擎”延续现有优势，负责处理基于数据的统计与抽象；“行动引擎”基于目标驱动，综合规划、搜索、推理、优化、记忆工具等环节；“理念引擎”则是创新关键，需嵌入数理化知识、知识图谱等科学认知体系，具备假设验证、抽象求解等能力，弥补经验驱动在长程推理、复杂模式分析上的短板，构建更强理解、适应与行动能力的世界模型。

智能超算领域的发展困境也成为大会焦点。“大模型的性能和效果会随着模型的参数量、数据量和计算量扩展，大算力是大模型发展的前置条件。”中科曙光高级副总裁李斌表示。据统计，全球人工智能计算机，每年保持2.5倍的增速，这个速度超过摩尔定律失效以前，超算发展黄金时期的最高增速。

但系统层面的挑战日益凸显，他指出：多场景适配难度大，“智能超算既要支撑大模型训练的大算力需求，又要适配科学计算的全精度要求，现有系统架构难以兼顾”；数据传输与计算性能失衡，“体系结构复杂化导致数据传输效率滞后于计算能力提升，现在大模型团队不得不深度参与系统工程化设计，才能保障训练效率”；能耗与可靠性压力剧增，“随着算力规模扩大，传统风冷已无法满足散热需求，万卡集群要实现数天无故障运行，对系统稳定性的挑战极大”。

对此，李斌提出技术演进路径：推动算力系统向多元融合方向发展，通过硅光传输、高压直供、液冷等技术突破硬件瓶颈，同时强化软硬件协同与产业链协作，“未来智能超算需实现从‘算力堆砌’到‘系统创新’的范式转变，才能支撑更多前沿应用落地”。

责任编辑：聂慧敏

网友评论

最热评论

没有更多评论了

大模型为何难破推理困局？ CNCC2025专家共探计算技术发展新方向

友情链接

抱歉，您使用的浏览器版本过低或开启了浏览器兼容模式，这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级，继续浏览