科技日报记者 崔爽
4月24日,DeepSeek V4-Pro和DeepSeek V4-Flash正式发布并开源,模型上下文处理长度由原有的128K显著扩展至1M,实现近10倍的容量提升,首次增加了KV Cache滑窗和压缩算法,大幅减少Attention计算和访存开销,并通过模型架构创新更好地支持了Agent和Coding场景。
记者获悉,华为宣布昇腾超节点全系列产品全面支持DeepSeek V4系列模型,模型发布、算力适配同步推进。
华为方面通过芯模技术协同,使昇腾950与昇腾A3超节点系列完成适配,并提供基于昇腾A3的训练参考实现,以支撑模型从训练到推理的全流程落地。
在推理性能层面,昇腾950超节点针对DeepSeek V4实现低时延与高吞吐的关键突破。
整体来看,DeepSeek V4在模型侧通过1M上下文、结构压缩与Agent能力提升,显著扩展应用边界;华为昇腾则在算力侧以950与A3超节点为核心,通过低时延、高吞吐、大规模互联等指标实现工程化承接。二者的同步推进,使长上下文、高性能推理、规模化部署的组合路径更加清晰,反映出开源模型与国产算力体系在协同演进中的加速态势。

网友评论