科技日报记者 崔爽
8月20日,智谱发布AutoGLM 2.0,其由智谱最新开源语言模型GLM-4.5与视觉推理模型GLM-4.5V驱动,并结合端到端异步强化学习的多项创新,现已面向普通用户开放并首次面向公众全面开放,用户无需邀请码即可使用。
去年10月,智谱AI发布可自主操作手机的智能体产品AutoGLM,可帮助用户完成点咖啡、发红包等任务。智谱方面介绍,本次发布的AutoGLM 2.0被定位为“执行型助手”。过去的AI多停留在“对话”层面,只能回答问题;一般的Agent(智能体)助手也多局限于信息查询和总结。AutoGLM2.0不再只是“说”,而是能够“做”,并且它能够在云端自主完成跨应用任务。
在生活场景中,用户一句话即可让AutoGLM 2.0操作抖音、小红书、美团、京东等40余款应用,完成点餐、订票、查房、预约等服务。在办公场景中,它也能跨应用执行完整流程,从检索资料到撰写文稿,再到生成视频、PPT或播客,并直接完成发布。
为支持这一能力,智谱为AutoGLM 2.0配备了专属云手机和云电脑,使其可以24小时独立运行。这意味着AI可在后台持续执行任务,不占用用户设备,成为用户“平行世界”的搭子。智谱还将AutoGLM 2.0的执行能力封装为API(应用程序接口),并启动开发者生态计划,让其能力可以扩展至AI眼镜、手表、家电等硬件。开发者只需简单接入,AutoGLM 2.0让硬件具备完整的手机级操作能力,无需在端侧堆叠复杂系统或大容量电池。相关展示中,用户可以直接通过Rokid智能眼镜点咖啡。
不久前,智谱发布新一代旗舰模型GLM-4.5,其为一款专为智能体应用打造的基础模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。