科技日报记者 崔爽
人工智能正迈入产业规模化应用的关键阶段。无论是对个人生产生活、行业运行模式,还是产业生态和产业形态,都在产生深刻影响。
作为连接基础算力、模型与应用落地的核心枢纽,AI计算框架的重要性愈发凸显。与此同时,随着超节点、智能体协同等新趋势不断涌现,AI框架也面临全新的技术挑战。
近日,在以“昇思MindSpore为超节点而生的AI框架”为主题的昇思人工智能框架峰会上,华为中央软件院总裁谢桂磊表示,昇思MindSpore聚焦超节点技术创新,打造昇思HyperParallel架构,加速新模型结构和新训推范式创新,引领AI框架迈入“超节点时代”。
打造新模型结构与训推范式
随着人工智能大模型技术的快速演进,模型规模向长序列和稀疏的十万亿级发展,模型结构趋于非规则化,训推范式走向异构化,模型发展正驱动AI基础设施从“服务器集群时代”迈入“超节点时代”,也为AI框架带来新的机遇和挑战。
谢桂磊介绍,在硬件层面,基于高速互联的“超节点”已经成为AI算力基础设施的新常态;在软件层面,如何降低集群,尤其是超节点的使用门槛,充分调度硬件资源、释放算力潜能,已成为框架技术发展的核心要素,也是当前面临的关键挑战之一。
在模型层面,大模型的Scaling Law(规模定律)仍在持续演进,模型正不断融合视觉、听觉、文本等多元信息,构建更加立体、丰富的智能世界。这对AI计算框架在全模态模型的复杂算子加速、多节点训练精度与效率优化等方面,提出更高要求。
在应用技术层面,AI Agent(智能体)已经进入规模化产业落地阶段。人工智能正从以单一对话解决问题的工具,升级为具备思考、规划、执行和反馈闭环能力的人工智能体。这也对AI框架提出了新的关键挑战,包括如何结合强化学习和后训练技术,增强长思维链构建与工具调度能力,优化多模型与工具的协同,推动AI Agent在更多行业实现更广泛、深入的应用。
围绕上述趋势与挑战,昇思MindSpore持续打造超节点亲和、全场景融合、架构开放、敏捷使能的人工智能框架。
“昇思在设计之初,就与超节点硬件进行了深度协同设计,总体目标就是把超节点当作一台‘超级计算机’,进行统一编程和调度。”昇思Mindspore社区技术委员会主席金雪锋介绍。
具体来看,昇思HyperParallel架构充分发挥超节点优势,实现HyperShard声明式并行编程、HyperMPMD异构非规则并行、HyperOffload多级智能卸载等关键能力,加速Agentic AI(代理式人工智能)、全模态等新模型结构与训推范式创新。
其中,HyperOffload通过实现计算与状态的解耦,利用超节点池化存储能力,有效缓解模型规模扩张带来的HBM(高带宽存储器)存储瓶颈,训练性能提升超20%,推理序列长度提升超70%;HyperMPMD发挥超节点对等计算架构优势,实现细粒度并行切分与通算并发,为强化学习、全模态提供灵活并行能力,将算力利用率提升超过15%;HyperShard屏蔽超节点集群拓扑的复杂性,为全模态等模型提供极简组合编程体验,新算法并行化改造时间少于1天,并行策略调优从天级压缩到小时级。
以开源共建加速AI创新
2020年3月28日,华为正式开源昇思MindSpore AI框架,迅速获得国内外开发者的积极响应。
会上发布的最新数据显示,昇思MindSpore下载量已超过1300万,覆盖全球156个国家和地区,代码合入请求超过12万次,社区贡献者超过5.2万人。框架已支持超过25个系列的大模型,有2000余家社区合作伙伴和3100余种行业应用实践,支撑近2500项学术论文创新成果,在所有AI框架中排名中国第一、全球第二,也让昇思成为最具创新活力的AI开源社区之一。
“昇思坚持开放治理,践行共建、共治、共享理念,积极融入业界生态,持续为开发者带来更优体验。”昇思MindSpore开源社区理事长丁诚表示,从入门级到专业级、科研级,不同层级的开发者正借助昇思实现AI的快速创新。
作为“工业皇冠上的明珠”,大飞机研发具有指标性意义,而空气动力设计是大飞机设计的核心环节。会上,中国工程院院士、中国商飞首席科学家吴光辉介绍,中国商飞上海飞机设计研究院基于昇思MindSpore框架持续创新,推出业界首个民机超临界翼型气动设计智能体——“御风·智翼”,构建基于工程经验的超临界翼型智能一站式解决方案。
“传统飞机设计流程环节多、周期长。过去设计一种新的翼型,需要经历复杂而耗时的计算过程。现在,在新的智能体体系下,气动设计师只需输入翼型几何外形需求,描述期望的几何特征,智能体即可实时生成设计方案,并通过优化模块实现自主优化。”吴光辉解释,在这一过程中,人工智能承担了建模、仿真、数字筛选等大量重复性工作,并支持通过自然语言对话方式完成操作,通过设计师与智能体的协同发力,实现了设计效率和设计质量的双重提升,重塑了民用飞机气动设计的新范式。
助推千行万业智能化转型
“人工智能的发展确实非常快。”谢桂磊强调,昇思Mindspore将在技术创新和生态拓展方面继续努力,以更前沿的技术、更易用的体验和更开放的社区,满足行业智能化转型需求。
在硬件层面,昇思Mindspore将持续围绕超节点推进软硬件深度协同,打造更加具备硬件亲和性的昇思框架,通过创新的分布式编程和运行范式,进一步降低超节点使用门槛,充分释放大规模集群的算力效能,更好地面向全模态模型、Agent、强化学习等核心场景,提供更完善的并行加速能力。
围绕全场景应用,昇思Mindspore将持续构建端—边—云协同的AI框架。既支持数万卡规模的训练,也覆盖耳机、手表等终端设备的训推能力,进一步降低AI应用门槛。
在生态建设方面,昇思Mindspore将以更加开放的姿态拥抱生态,提供架构灵活、组件化、可复用的AI框架,并与社区、生态伙伴共享在超节点、全模态Agent等方面的最新技术进展和成果。
围绕关键应用场景,特别是AI for Science等方向,昇思MindSpore也将持续打造更加行业敏捷的AI框架。
“过去几年,昇思已与多个领域的科学家团队开展合作,在流体力学、电子仿真、分子模拟等领域,通过AI手段解决传统计算问题。未来还将进一步结合Agent技术,与业界共同探索AI for Science的更多可能性。”谢桂磊表示,“人工智能有望进一步加速科研创新和产业变革,我们对此充满期待。”

网友评论