科技日报记者 李禾
近日,记者从沨呵智慧科技(上海)有限公司(以下简称沨呵智慧)获悉,随着大模型发展,为量化Token(词元)生产效率,沨呵智慧推出智算中心理论算力侵蚀现状与解决方案,通过精益调度、智能运维和全链路优化,解决GPU资源闲置、低效运行等问题,Token产出效率实现大幅提升,进而推动智算产业迈向“Token精细化运营时代”。
“AI产业正经历一次深刻转变。”沨呵智慧有关负责人表示,在传统模式下,智算中心主要采用“裸金属租赁”方式运营,即客户按GPU卡时、服务器节点或机柜资源进行采购,运营商通过出租硬件获取收益。但随着大模型的发展,对算力需求的大幅增长,上述模式暴露出越来越多的局限性。对客户而言,他们需要的并不是GPU,而是模型训练结果和推理能力;对智算中心而言,真正创造价值的也不是GPU本身,而是GPU最终产出的Token。

上述负责人解释道,如果说GPU是工厂里的机器,Token就是工厂生产出来的产品。如今大模型推理服务,本质上是一种Token生产过程:用户运用模型计算,最终获得Token。因此,衡量一个智算中心经营水平的关键指标,不再是拥有多少GPU、建设多少机柜,而是每分每秒产生多少Token,每百万Token成本是多少?在这种背景下,AI企业开始逐步转向采用Token作为经营和计费单位。Token成为AI时代的新“数字商品”,智算中心正演变为Token工厂。“算力产业未来竞争的核心,将从GPU数量走向Token制造效率。”
(受访者供图)

网友评论