科技日报记者 何沛苁
3月27日,由趋境科技与九源智能计算系统生态联合体共同主办的2026中关村论坛年会“全栈智能 全域推理:Token爆发元年的全场景大规模推理服务”专题研讨会成功举办。与会专家聚焦大模型时代推理服务的核心技术、产业实践和生态协同,共探高效、稳定、安全、普惠的大模型推理服务体系建设。
“2026年已成为名副其实的‘Token爆发元年’,AI产业的核心关注焦点,正从‘模型参数规模、模型可用性’全面转向‘稳定、低成本、高质量交付的Token产能’。”中国工程院院士、九源智能计算系统生态联合体理事长、趋境科技首席科学顾问郑纬民在主旨演讲中指出,传统模型服务的核心是保障模型可得性与接口完整性,而Token服务的核心是保障Token产能的可用性,更关注成本、吞吐、时延与可靠性等生产性指标,是一个极端复杂的多维系统最优化问题,必须完成全链路的系统级创新。对此,郑纬民院士明确了TaaS(Token即服务)发展的三大核心技术底座,即全系统异构协同;存算协同实现“以存换算”;面向SLO的智能调度,精准将用户业务需求“翻译”为底层资源决策。郑纬民表示:“只有让智能生成像水电一样被稳定地调度与供给,才能真正迎来算力制造Token为王的普惠智能时代。”
此外,并行科技、九源智能计算系统生态联合体、中科曙光、京东云、阿里云、华为、商汤科技等企业代表,围绕国产算力多场景推理优化实践、推理框架实践、Token时代AI引擎、算力底座高效推理等前沿议题展开深入分享。
圆桌对话环节,清华大学计算机系副教授章明星、中国移动数智化部副总经理陈国、趋境科技Mooncake首席工程师杨珂等嘉宾,围绕“国产推理基础设施从‘可用’到‘好用’的路线选择与关键突破”展开探讨。各方凝聚三大共识:一是软硬深度协同是释放国产算力潜能的关键,需通过系统级优化弥合硬件性能与业务需求之间的鸿沟;二是生态统一与标准建设至关重要,打破“百花齐放”带来的适配难题,方能实现规模化应用;三是人才培养是产业根基,需通过开源社区、技术竞赛等方式,培育兼具理论与工程能力的AI基础设施人才。

大会现场还发布了趋境ATaaS高效能AI Token生产服务平台。该平台将有效破解大额硬件投入难以转化为优质Token产能、资源浪费与成本空耗突出等行业困境,以高效能Token生产为核心目标,可支撑万级AI推理需求,实现日均万亿级Token产能,推动算力基础设施从“数据中心”向“Token工厂”全面升级演进。
大会同期宣布,2026年春季启元人工智能大赛正式启动。赛事旨在通过赛教融合,为国产智能计算生态培育新一代人才,持续推动AI产业的开源创新与规模化应用。

网友评论