推理加速存储AS3000G7发布助力大模型规模化落地

2025-07-30 21:42:51 来源: 科技日报点击数：

科技日报记者华凌

7月25日，2025（第二届）产融合作大会举行。会上，浪潮存储发布推理加速存储AS3000G7，有效破解KV Cache重复计算带来的算力和时延损耗难题，为大模型推理场景提供突破性解决方案，加速推动大模型在金融、科研等领域的规模化落地。

IDC数据显示，智能算力规模在未来5年增长1.7倍，用于推理的工作负载将从2023年的40%上升到2027年的70%以上。然而，当前大模型推理仍然需要借助GPU服务器来实现，而GPU服务器，也是整个大模型落地中最昂贵的投资。因此，充分发挥GPU服务器的利用率来提升大模型推理效率是关键，推理效率的高低直接决定大模型从“实验室”到“生产线”的落地速度。

现场，浪潮存储营销总监张业兴发表题为《融存智用运筹新数据——浪潮存储金融解决方案和实践》的主题演讲，并表示，浪潮存储AS3000G7可存储所有KV Cache及多轮对话结果。其创新架构通过将KV Cache从GPU写入本机内存，再经高速网络缓存至AS3000G7，下轮对话时按需拉取缓存无须重新计算，彻底实现“以存代算”，显著节省算力消耗并提升资源利用率。

此次大会由中国信息通信研究院主办。

（受访者供图）

责任编辑：陈可轩

推理加速存储AS3000G7发布助力大模型规模化落地

友情链接

抱歉，您使用的浏览器版本过低或开启了浏览器兼容模式，这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级，继续浏览

推理加速存储AS3000G7发布 助力大模型规模化落地

友情链接

抱歉，您使用的浏览器版本过低或开启了浏览器兼容模式，这会影响您正常浏览本网页

您可以进行以下操作:

1.将浏览器切换回极速模式

2.点击下面图标升级或更换您的浏览器

3.暂不升级，继续浏览

推理加速存储AS3000G7发布助力大模型规模化落地