DeepSeek联合北大、清华发布新论文,推出智能体推理框架DualPath。针对智能体大模型推理的存储带宽瓶颈,创新双路径KV-Cache加载机制,让数据读取与GPU计算并行,彻底解决传统架构算力空转问题。实测离线推理吞吐量最高提升1.87倍,在线Agent运行效率提升1.96倍,用纯软件优化实现性能翻倍,堪称AI基础设施的颠覆性突破,为智能体时代筑牢技术根基。
(科技日报 李忠明 赵卫华)
DeepSeek联合北大、清华发布新论文,推出智能体推理框架DualPath。针对智能体大模型推理的存储带宽瓶颈,创新双路径KV-Cache加载机制,让数据读取与GPU计算并行,彻底解决传统架构算力空转问题。实测离线推理吞吐量最高提升1.87倍,在线Agent运行效率提升1.96倍,用纯软件优化实现性能翻倍,堪称AI基础设施的颠覆性突破,为智能体时代筑牢技术根基。
(科技日报 李忠明 赵卫华)
网友评论