荣耀发布MagicGUI大模型并开源  赋予手机“自动驾驶”能力

2025-07-26 19:19:08 来源: 科技日报 点击数:

科技日报记者 罗云鹏

“帮我订明早8点去机场的车,走高速优先。”话音刚落,手机屏幕随即亮起,多个打车应用被同时唤醒。目的地栏自动填入“深圳宝安国际机场T3”后,“高速优先”选项被精准勾选……最终,订单确认按钮在无人触碰下自动按下。整个过程行云流水,仿佛有一双无形的“手”在操控手机。

这双“手”,正是7月26日荣耀在2025世界人工智能大会期间发布的MagicGUI大模型。作为荣耀推出的首个GUI开源大模型,这款拥有70亿参数的多模态理解模型,正重新定义智能手机的角色:从被动响应指令的工具,进化为能主动解决问题的“数字助理”。

打破App孤岛 让手机学会“跨应用思考”

荣耀首席执行官李健此前曾介绍,荣耀已打造“一语打车、一语搜索、一语看屏”等八大“一语”AI功能,目标是“一语解千愁,万事找YOYO”。

如今,MagicGUI大模型已实际应用于荣耀新一代折叠旗舰Magic V5,并由手机搭载的YOYO智能体执行。

荣耀MagicOS副总裁孙建发介绍:“从技术主体来看,移动时代的技术主体是Apps应用;AI时代的技术主体是AI智能体。”

与被动响应的应用不同,AI智能体需要具备自主感知、规划、反思并最终完成任务的能力。

以“一语打车”场景为例,在用户授权下,YOYO依托MagicGUI的任务规划和执行能力,可在高德、滴滴等App中完成打开应用、修改地址、选择车型、下发或取消订单等一系列操作。

其中,荣耀MagicGUI大模型则根据屏幕视觉信息边思考边执行,并依据当前页面操作反馈,精准推理出下一步最佳操作,显著提升智能体操作App的智能性和效率。

除了打车,结合MagicGUI的动作执行能力,YOYO还能高效完成在常见App主页搜索、查看订单与购物车等操作。

而当用户表达模糊、无法完成操作或“自动驾驶”遇到突发情况时,MagicGUI模型的主动拒识能力可实现智能切换,由人工接管,保障操作流程顺畅无阻。

如何让YOYO从执行单一任务进化为多智能体协同处理复杂任务?这背后涉及复杂任务的拆解、执行和闭环。

据了解,荣耀AI团队采用了两段式训练方案。一则通过数据自动爬取与合成方法构建数据生成框架,产出丰富的训练数据,并通过继续预训练流程为模型注入移动端理解操控所需的海量知识。

同时,采用DF-GRPO算法(一种强化学习算法),通过强化学习激发模型的知识表达,进一步提升模型的效果和泛化能力。

得益于独特的训练框架,MagicGUI模型在千万级GUI数据中学习界面元素关联性,再通过强化训练掌握操作策略。在荣耀Magic V5常用场景用机操控中达到91.5%准确率,较行业同类顶级开源模型提升16.4个百分点。

场景落地 从隐私安全闭环到重新定义终端AI协作

时下,智能体作为新一代信息技术与实体经济融合的关键载体,正从概念走向实践,正以“高效协同、自主进化”的特性,重塑产业形态,催生新的增长动能。

在2025世界人工智能大会人工智能标准化国际合作论坛上,荣耀作为首批单位,将携手阿里、百度等百余家行业企业共同发布了《智能体协议共建共享联合倡议》,旨在将进一步推动人工智能领域的标准化发展与国际合作。

时间回溯到2023年,荣耀与复旦大学共同建立自然语言处理大模型校企联合实验室,在自然语言处理、多模态大模型、Agent等领域共同探索AI技术前沿,赋能价值场景。

荣耀MagicGUI大模型便是双方共同探索与努力的技术成果,通过数据采集与生成框架、训练方案设计与强化学习算法创新,共同构建移动终端屏幕业界领先的理解操控模型能力,让智能化打车与常用App操控特性迅速落地。

当前,移动终端设备作为承载用户隐私数据的平台,如何保护用户隐私、保障信息安全始终是其核心挑战与首要任务。

值得一提的是,荣耀采用的权威隐私保护方法和实践均得到业界公认,并且通过了包括ISO/IEC 27701、ISO/IEC 27001、ePrivacyseal等在内一系列国际权威隐私安全认证。

从“工具”到“助理”是能力本质的跃迁。当多数厂商仍在比拼语音助手诗词创作能力时,荣耀选择攻坚“办成事”的硬指标。

目前,荣耀MagicGUI大模型报告已在GitHub平台发布,模型与相关测试数据将于近期上线相关开源平台。不难看出,“一语打车”仅是第一步,荣耀MagicGUI大模型的开源策略也将激发更多生态裂变。

(受访单位供图)

责任编辑:冷媚

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览