科技日报记者 叶青
11月19日,2024年世界互联网大会领先科技奖发布,腾讯Angel机器学习平台凭借卓越的技术积累、创新的关键技术和广泛的应用场景,荣获本年度领先科技奖。
据介绍,腾讯Angel机器学习平台突破了万亿级模型分布式训练和推理以及大规模应用部署等难题,率先实现大模型技术从底层硬件到关键软件技术的自主研发,在业务场景广泛应用。
该平台针对万亿规模大模型分布式训练和推理、应用部署难的挑战,在网络互联、框架效率、平台规模三方面实现了突破。
在通信方面,从网卡到交换机,再到路由协议,腾讯自研的RDMA网络实现了集群高速互联,单节点带宽达到3.2T,相比于同类领先产品,性能提升30%,成本降低70%。在效率方面,腾讯自研了训练/推理框架,提出显存加主存的一体化机制,实现多维并行和算子优化,相比开源框架,训练性能提升2.6倍,推理速度提升2.3倍。在规模方面,该平台实现了单任务万卡的线性扩展,GPU集群加速比从50%提升到99%。
目前,基于腾讯Angel机器学习平台,腾讯混元大模型已经构建了从0.5B到70B不同尺寸的通用模型和领域模型,涵盖了语言模型、多模态理解模型和多模态生成模型等。这些模型已被应用在超过700个腾讯业务场景。此外,该平台通过腾讯云输出,广泛应用在大模型、广告、推荐、社交、金融等领域,助力实体行业进行数智化升级。
腾讯公司副总裁蒋杰表示,获得本次世界互联网大会领先科技奖,是对腾讯在大模型相关自研技术的认可。在大模型时代,模型参数超过万亿,训练数据超过10万亿,庞大的规模,给模型训练和推理带来巨大挑战,腾讯全链路自研的Angel机器学习平台能有效应对这些挑战,实现多个方面的性能效率提升。未来,腾讯也将继续投入底层技术自主研发,并通过开源共享,推动技术创新升级,让智能技术走入千行百业。
世界互联网大会领先科技奖由世界互联网大会主办,旨在奖励全球年度最具领先性的互联网科技成果,倡导互联网技术国际交流合作。本年度共有20个项目获奖,涵盖类脑计算、具身智能、6G、大数据、AI机器学习平台等前沿领域。