科技日报记者 付丽丽
5月27日,在中科创星硬科技媒体行——清程极智专场活动中,清程极智团队系统介绍了以赤兔推理引擎、AI Ping评测路由平台、八卦炉智能软件栈为核心的全链路Token解决方案。活动现场,清程极智围绕大模型推理降本、国产算力生态适配、Token服务质量与性价比三大行业关键痛点,集中展示多项核心技术突破与规模化落地成果,以技术创新推动中国AI产业从“能用”迈向好用、省钱、自主可控的新阶段。

当前,全球AI产业已进入规模化落地的关键阶段,Token成为AI时代的“水电煤”,是大模型服务与智能应用的核心生产要素。数据显示,2024年初至2026年3月,中国Token日均调用量激增超千倍,规模突破140万亿。伴随Agent智能体、多模态应用快速普及,Token正从交互用量转向生产用量,直接推动产业对推理效率、部署成本、服务稳定性的要求持续攀升。
在Token需求爆发的同时,国产算力与国产模型迎来高速发展,但二者之间的推理环节却长期依赖海外引擎,难以充分释放国产硬件性能;而Token服务市场也面临乱、贵、慢、选型难等突出问题,供需错位、成本高企、体验不一,成为制约AI技术普惠化、规模化落地的核心瓶颈。
针对大模型部署成本高、国产算力适配不足的痛点,清程极智推出赤兔推理引擎。作为完全自主研发的国产推理引擎,赤兔打破海外技术垄断,构建“国产算力+国产引擎+国产模型”全国产化闭环,针对昇腾、海光、沐曦、摩尔线程等国产芯片的硬件特性深度优化,实现标量向量计算、数据表达、硬件调度、卡间互联的全维度适配,解决国产算力“能用不好用”的难题。
面对Token服务市场服务商林立、指标混乱、选型成本高的行业乱象,清程极智打造AI Ping一站式大模型服务评测与API智能路由平台,成为国内首个集“信息汇总、客观评测、智能路由”于一体的Token服务枢纽。平台已接入30余家主流服务商、600余个大模型服务,覆盖文本、图片、视频等全场景;通过7×24小时多地域分布式监测,实时输出延迟、吞吐、可靠性、价格等核心指标,数据真实可核验;依托智能路由算法,以统一API接口为用户自动匹配最优服务商,实现成本降低超37%、吞吐量提升超90%、延迟降低超20%,让开发者“一键调用、省心省钱”,专注业务创新。
此外,清程极智还推出八卦炉智能软件栈,面向大模型训练、微调场景提供高效Token生产与智能调度能力,与赤兔推理引擎、AI Ping平台形成协同,覆盖AI“训练—推理—应用”全流程,构建完整的AI基础设施生态。
据悉,清程极智成立于2023年12月,核心团队来自清华大学计算机系高性能计算所,是国内专注AI基础设施的标杆企业,致力于打造一站式全链路Token解决方案。相关负责人表示,公司将持续深耕AI基础设施领域,坚持核心技术自主可控,不断迭代赤兔推理引擎对国产芯片的适配能力,完善AI Ping评测与路由服务,联动国产算力、国产模型、行业应用等产业链伙伴,打造高效、普惠、安全的国产AI基础设施体系,以技术创新推动中国AI产业高质量发展。

网友评论