科技日报记者 华凌
近日,清华系大模型明星企业智谱发布新一代旗舰模型GLM-4.5,即专为智能体应用打造的基础模型。据悉,这一基础模型已在Hugging Face与ModelScope平台同步开源。
目前,编程能力正成为大模型的重要能力。然而,之前大模型编程面临着长程逻辑链断裂、动态调试能力弱、交互与协作瓶颈等问题。针对这一现状,智谱此次推出的GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。
智谱相关负责人表示:“衡量AGI的第一性原理,是在不损失原有能力的前提下融合更多通用智能能力,GLM-4.5是我们对此理念的首次完整呈现,并有幸取得技术突破。”
据技术人员介绍,GLM-4.5参数量为DeepSeek-R1的二分之一、Kimi-K2的三分之一,但在多项标准基准测试中表现得更好,得益于模型更高的参数效率。在性能优化之外,GLM-4.5系列也在成本和效率上实现突破:API调用价格低至输入价格为0.8元/百万tokens,输出价格2元/百万tokens,大幅低于目前主流的模型定价。
为综合衡量模型的通用能力,技术团队选择了最具有代表性的12个评测基准,综合平均分,GLM-4.5取得了全球模型第三、国产模型第一,开源模型第一。实测结果显示,GLM-4.5相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。
据了解,GLM-4.5兼容Claude Code、Cline、Roo Code等主流代码智能体,海内外用户可以在智谱开放平台体验。