CloudMatrix384超节点支持DeepSeek-V3.2-Exp,第一时间上线华为云

互联网
2025
09/30
09:58
分享
评论

2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。华为云第一时间完成对 DeepSeek-V3.2-Exp 模型的适配工作,最大可支持160K长序列上下文长度。目前,该模型已正式上架华为云大模型即服务平台 MaaS,为企业及开发者提供模型体验和 API 服务。

微信图片_20250930093227.jpg

华为云ModelArts推理平台基于CloudMatrix384基础设施,为DeepSeek-V3.2-Exp模型提供稳定、高可靠推理服务。ModelArts推理平台能够根据实际负载需求,按需供给和分配模型推理算力资源,实现资源分时复用与灵活扩缩容。针对DeepSeek-V3.2-Exp 模型,此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。

即刻开始体验:

目前可访问华为云官网,体验DeepSeek-V3.2-Exp模型的卓越能力:

访问华为云官网首页——导航菜单“大模型”——“DeepSeek-V3.2-Exp”模型“立即体验”,进入大模型服务平台模型体验页面,选择“DeepSeek-V3.2-Exp”模型体验。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3