华为云发布盘古大模型5.5 新一代昇腾AI云服务上线

2025-06-20 20:48:26 来源: 科技日报 点击数:

科技日报记者 崔爽

6月20日,华为开发者大会2025(HDC 2025)在广东省东莞市举行。

会上,华为常务董事、华为云计算CEO张平安宣布基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,为大模型应用提供澎湃算力;宣布盘古大模型5.5正式发布,自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型全面升级。同时,张平安还分享了盘古大模型在农业、工业、科研等领域的丰富创新应用和落地实践,持续深入行业解难题,成就行业AI先锋。

随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。华为云新一代昇腾AI云服务基于CloudMatrix 384超节点,首创将384颗昇腾NPU(神经网络处理器)和192颗鲲鹏CPU(中央处理器)通过全新高速网络全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300 Tokens/s(模型一秒钟可以处理的字符数),与非超节点相比提升近4倍。超节点架构能更好地支持混合多专家MoE大模型的推理,可以实现“一卡一专家”,一个超节点可以支持384个专家并行推理,极大提升效率;同时,超节点还可以支持“一卡一算子任务”,灵活分配资源,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升50%以上。

大会上,华为云发布盘古大模型5.5,模型在高效长序列、低幻觉、快慢思考融合、Agent(智能体)等特性上进行升级,提升用户体验。

会上,张平安还发布盘古医学、金融、政务、工业、汽车五个具备深度思考能力的行业自然语言大模型,加速行业智能化,并将在6月底正式上线。

记者从会上了解到,华为云是华为公司面向开发者的统一底座,目标是打造昇腾、鸿蒙、鲲鹏、欧拉等各项根技术的生态。如今,华为云开发者已超过800万;华为云作为云底座,支持鲲鹏、昇腾、鸿蒙等生态的开发者总计达到1300万。

为了给开发者提供AI时代的智能应用开发体验,华为开发者空间全面升级,提供的开发资源从基础算力扩展到AI原生应用引擎、鸿蒙云手机等上层应用。基于这些全新的开发资源,开发者可以便捷地调用算力、大模型、Agent工具等华为云服务来开发智能应用。

此外,华为开发者大赛2025赛季也宣布正式启动。大赛首次设置昇腾AI全栈技术赛道,融合鸿蒙原生、开发者空间,邀请全球高校学子和技术精英们通过开发者大赛,勇闯智能新世界。

(主办方供图)

责任编辑:陈可轩

抱歉,您使用的浏览器版本过低或开启了浏览器兼容模式,这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级,继续浏览

继续浏览