科技日报记者 张佳星
“算力是数字经济时代的核心生产力,正在不断催生新技术、新模式、新业态,助力各行业加快数字化智能化的转型。”在10月9日青云科技举办的2024 AI算力发布会上,北京中关村朝阳园党工委副书记、管委会主任娄毅翔坦言,需要通过搭建产业的共性技术平台、打造标杆示范应用场景等方式,促成算力的充分应用,以进一步助力人工智能技术落地产业。
“无论是高校院所开展人工智能领域的科学研究,还是中小企业开展人工智能模型的训练,都会面临算力不足的问题。”青云科技智算产品负责人苗慧表示,算力自建成本高昂,包括国产芯片在内的不同类型人工智能芯片(GPU)需要打通等问题,成为掣肘人工智能应用广泛落地的重要因素。
搭建平台,为AI提供弹性算力服务
“不同行业需要的算力存在不同的规律。”苗慧解释,例如,自动驾驶行业对于数据的处理不是时时需要计算,而是大量传回图片数据,只有部分需要计算。根据行业特点,青云智算为其建设了多地区多中心的数据存储区域,用于其数据的内部流转,流转计算后,再将不必要的数据备份后删除,以提升GPU使用效率。
相较而言,科研单位对算力的需求存在波峰波谷。“高校院所并不是要生成一个大模型产品,更多的是用行业数据来调试其研发的算法。”苗慧说,通过GPU切分实现了GPU的高效使用,在算力需求波谷时能够匹配更低的算力,降低其使用成本,在需求波峰时切分GPU重新整合,提供足够的算力。
“算力的智能化,不仅把算法工程师从底层基础设施架构整合工作中解放出来,还有效降低算法工程师管理数据的难度。”苗慧介绍。
打通壁垒,让算力“引擎”合力发动
“一段时间以来,包括金融领域在内的企业持续推动AI领域验证性示范落地。”青云科技CEO林源表示,当前的产业发展趋势亟待进一步降低算力使用门槛。
然而,随着底层基础设施的发展,提供算力的“引擎”架构变得更加复杂。林源解释,芯片架构发生变化,从CPU到GPU,再到不同GPU的调度和使用优化,对芯片的管理提出了新挑战,也影响着服务器的架构。
如何更有效管理新的算力架构?“在实践中,我们发现打通不同底层逻辑的芯片系统,通过统一调度、智能管理,能够为AI技术研发提供恰到好处的算力。”苗慧介绍,通过底层打通,青云科技AI智算平台能够对包括曙光、昇腾、英伟达等提供的异构算力实现统一管理与调度,并通过开放的架构纵向融合多样的AI技术。
林源介绍,基于与不同芯片厂商、算力供应商、存储设备企业的协同合作,算力的底层基础设施壁垒不断打通。当前从青海到北京、从广东到内蒙古都可以实现迅捷的算力调度和使用。
据介绍,包括青云科技在内的200余家行业上下游企业紧密合作,通过算力共赢、算力加速等计划,完成了百余项生态适配项目,以资源共享与优势互补来推动智算产业的整体发展。
娄毅翔认为,作为在朝阳区创立成长的代表性企业,青云科技搭建起产业合作生态体系,为各行业提供算力基础设施、AI应用服务等算力服务,加速AI场景在各个应用行业中普及落地。