科技日报记者 崔爽
记者获悉,中国联通数据科学与人工智能研究院提出并开源的全新扩散模型加速框架LeMiCa(Lexicographic Minimax Path Caching),入选国际人工智能领域会议NeurIPS 2025 Spotlight,在全球超过2万篇投稿中,成为入选的3.1%。
当前,以谷歌Nano-Banana、OpenAI Sora2等为代表的文生图、文生视频模型正快速发展,但仍面临“快”与“精”的两难,快了质量差,精了速度慢,影响规模化应用。
而广泛使用的扩散模型(Diffusion Model)架构通过多步迭代采样去噪生成内容,每步都需全量计算,导致生成耗时长、成本偏高。业界主流的局部贪心缓存(Local-Greedy Caching)优化方案因只关注局部,又容易造成生成内容失真。
据介绍,LeMiCa方案通过融合人工经验与数据驱动的创新方法论,将推理速度提升2倍以上,同时保持高质量生成效果。
其以全局视角优化生成路径,最大限度减少累积误差。研究院通过大量实验发现,原始迭代采样步骤具有可复用性,且蕴含可跨不同提示词的全局规律,因此提出通过人工经验离线解算全局最优路径,与数据驱动的模型在线推理相结合,在不额外增加推理耗时的前提下实现高效加速。
LeMiCa相当于具备全局调度能力的“导演”,在提升生成速度的同时保持画面质量、风格与细节的高度一致与连贯。
LeMiCa现已全面集成至联通元景MaaS平台,支撑文生图、图像编辑、文生视频等多项模型服务,并在文创、品宣等多个行业场景中落地应用。
据了解,NeurIPS(神经信息处理系统大会)是全球机器学习和人工智能领域重要学术会议,内容涵盖人工智能领域的机器学习、深度学习、计算机视觉等多个方向。

网友评论