您现在的位置是:首页 > 快讯快讯
DeepSeek-V3.2-Exp模型正式发布并开源
zhoucl 2025-09-29 18:40:30 快讯 已有人查阅
导读DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏Attention架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台MaaS,针对DeepSeek-V3.2-Exp模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
DeepSeek-V3.2-Exp模型正式发布并开源,采用稀疏Attention架构,显著降低计算资源消耗,提升推理效率。
该模型已上线华为云大模型即服务平台(MaaS),部署沿用大EP并行方案,结合稀疏Attention结构与长序列友好的上下文并行策略,优化时延与吞吐性能。
本文标签:
很赞哦! ()