荣耀发布MagicGUI大模型并开源赋予手机“自动驾驶”能力

2025-07-26 19:19:08 来源: 科技日报点击数：

科技日报记者罗云鹏

“帮我订明早8点去机场的车，走高速优先。”话音刚落，手机屏幕随即亮起，多个打车应用被同时唤醒。目的地栏自动填入“深圳宝安国际机场T3”后，“高速优先”选项被精准勾选……最终，订单确认按钮在无人触碰下自动按下。整个过程行云流水，仿佛有一双无形的“手”在操控手机。

这双“手”，正是7月26日荣耀在2025世界人工智能大会期间发布的MagicGUI大模型。作为荣耀推出的首个GUI开源大模型，这款拥有70亿参数的多模态理解模型，正重新定义智能手机的角色：从被动响应指令的工具，进化为能主动解决问题的“数字助理”。

打破App孤岛让手机学会“跨应用思考”

荣耀首席执行官李健此前曾介绍，荣耀已打造“一语打车、一语搜索、一语看屏”等八大“一语”AI功能，目标是“一语解千愁，万事找YOYO”。

如今，MagicGUI大模型已实际应用于荣耀新一代折叠旗舰Magic V5，并由手机搭载的YOYO智能体执行。

荣耀MagicOS副总裁孙建发介绍：“从技术主体来看，移动时代的技术主体是Apps应用；AI时代的技术主体是AI智能体。”

与被动响应的应用不同，AI智能体需要具备自主感知、规划、反思并最终完成任务的能力。

以“一语打车”场景为例，在用户授权下，YOYO依托MagicGUI的任务规划和执行能力，可在高德、滴滴等App中完成打开应用、修改地址、选择车型、下发或取消订单等一系列操作。

其中，荣耀MagicGUI大模型则根据屏幕视觉信息边思考边执行，并依据当前页面操作反馈，精准推理出下一步最佳操作，显著提升智能体操作App的智能性和效率。

除了打车，结合MagicGUI的动作执行能力，YOYO还能高效完成在常见App主页搜索、查看订单与购物车等操作。

而当用户表达模糊、无法完成操作或“自动驾驶”遇到突发情况时，MagicGUI模型的主动拒识能力可实现智能切换，由人工接管，保障操作流程顺畅无阻。

如何让YOYO从执行单一任务进化为多智能体协同处理复杂任务？这背后涉及复杂任务的拆解、执行和闭环。

据了解，荣耀AI团队采用了两段式训练方案。一则通过数据自动爬取与合成方法构建数据生成框架，产出丰富的训练数据，并通过继续预训练流程为模型注入移动端理解操控所需的海量知识。

同时，采用DF-GRPO算法（一种强化学习算法），通过强化学习激发模型的知识表达，进一步提升模型的效果和泛化能力。

得益于独特的训练框架，MagicGUI模型在千万级GUI数据中学习界面元素关联性，再通过强化训练掌握操作策略。在荣耀Magic V5常用场景用机操控中达到91.5%准确率，较行业同类顶级开源模型提升16.4个百分点。

场景落地从隐私安全闭环到重新定义终端AI协作

时下，智能体作为新一代信息技术与实体经济融合的关键载体，正从概念走向实践，正以“高效协同、自主进化”的特性，重塑产业形态，催生新的增长动能。

在2025世界人工智能大会人工智能标准化国际合作论坛上，荣耀作为首批单位，将携手阿里、百度等百余家行业企业共同发布了《智能体协议共建共享联合倡议》，旨在将进一步推动人工智能领域的标准化发展与国际合作。

时间回溯到2023年，荣耀与复旦大学共同建立自然语言处理大模型校企联合实验室，在自然语言处理、多模态大模型、Agent等领域共同探索AI技术前沿，赋能价值场景。

荣耀MagicGUI大模型便是双方共同探索与努力的技术成果，通过数据采集与生成框架、训练方案设计与强化学习算法创新，共同构建移动终端屏幕业界领先的理解操控模型能力，让智能化打车与常用App操控特性迅速落地。

当前，移动终端设备作为承载用户隐私数据的平台，如何保护用户隐私、保障信息安全始终是其核心挑战与首要任务。

值得一提的是，荣耀采用的权威隐私保护方法和实践均得到业界公认，并且通过了包括ISO/IEC 27701、ISO/IEC 27001、ePrivacyseal等在内一系列国际权威隐私安全认证。

从“工具”到“助理”是能力本质的跃迁。当多数厂商仍在比拼语音助手诗词创作能力时，荣耀选择攻坚“办成事”的硬指标。

目前，荣耀MagicGUI大模型报告已在GitHub平台发布，模型与相关测试数据将于近期上线相关开源平台。不难看出，“一语打车”仅是第一步，荣耀MagicGUI大模型的开源策略也将激发更多生态裂变。

（受访单位供图）

责任编辑：冷媚

1.将浏览器切换回极速模式