科技日报记者 朱虹
“在一元二阶逻辑测试中,主流大模型得分接近0分,离通用人工智能的要求还有巨大差距。”10月23日,在哈尔滨开幕的第22届中国计算机大会(CNCC2025)上,华为公司战略研究院院长周红抛出的问题,直指当前人工智能发展的核心痛点。这场以“数智赋能、无限可能”为主题的行业盛会,吸引12011人注册参会、900余名讲者齐聚,不仅呈现计算技术前沿成果,更围绕大模型、智能超算等领域的瓶颈与破局路径展开深度研讨,为数字经济时代计算技术发展锚定方向。
当前,计算技术已进入多领域渗透、多学科融合的爆发期。会上多位专家为我们展现了人工智能的多场景应用,工业领域中,AI助力炼钢高炉温度精准调控,可降低千万级成本;医疗领域,虚拟手术模拟器可替代动物实验、优化手术方案;科研领域,人工智能实现流体计算效率提升1000倍。计算技术正以“数智赋能”重塑生产、生活、科研范式。
然而,技术快速迭代背后,瓶颈问题同样突出。周红指出,当前大模型存在三大核心挑战:认知偏差导致泛化能力弱,“比如仅获取多面体两面信息,几乎无法预测第三面,甚至在学习加法时,未训练过的数值区间就容易出现预测失误”;数据与能源效率极低,人类高质量文本数据或将在2028年用完,而大模型对文本数据的需求比人类实际情况高10万倍甚至更多,能源消耗更是远超人类大脑;在组合爆炸与长程推理上的能力是明显短板,当前大模型擅长局部数据的统计与抽象,却难以处理周期性,以及更加复杂的规律与方法。
针对这些问题,他提出构建“世界模型”的解决方案:当前深度学习依赖数据驱动形成的“经验引擎”存在明显局限,难以支撑复杂场景下的智能需求,因此“世界模型”的核心思路是打破单一技术路径依赖,构建“经验引擎+行动引擎+理念引擎”三引擎协同体系。其中,“经验引擎”延续现有优势,负责处理基于数据的统计与抽象;“行动引擎”基于目标驱动,综合规划、搜索、推理、优化、记忆工具等环节;“理念引擎”则是创新关键,需嵌入数理化知识、知识图谱等科学认知体系,具备假设验证、抽象求解等能力,弥补经验驱动在长程推理、复杂模式分析上的短板,构建更强理解、适应与行动能力的世界模型。
智能超算领域的发展困境也成为大会焦点。“大模型的性能和效果会随着模型的参数量、数据量和计算量扩展,大算力是大模型发展的前置条件。”中科曙光高级副总裁李斌表示。据统计,全球人工智能计算机,每年保持2.5倍的增速,这个速度超过摩尔定律失效以前,超算发展黄金时期的最高增速。
但系统层面的挑战日益凸显,他指出:多场景适配难度大,“智能超算既要支撑大模型训练的大算力需求,又要适配科学计算的全精度要求,现有系统架构难以兼顾”;数据传输与计算性能失衡,“体系结构复杂化导致数据传输效率滞后于计算能力提升,现在大模型团队不得不深度参与系统工程化设计,才能保障训练效率”;能耗与可靠性压力剧增,“随着算力规模扩大,传统风冷已无法满足散热需求,万卡集群要实现数天无故障运行,对系统稳定性的挑战极大”。
对此,李斌提出技术演进路径:推动算力系统向多元融合方向发展,通过硅光传输、高压直供、液冷等技术突破硬件瓶颈,同时强化软硬件协同与产业链协作,“未来智能超算需实现从‘算力堆砌’到‘系统创新’的范式转变,才能支撑更多前沿应用落地”。

网友评论