国产GPU斩获14.88亿元AI训推一体机大单

业界

2025

02/26

14:56

芯智讯

随着国产AI大模型DeepSeek的持续火爆，DeepSeek官方服务器一直是超负荷，已经无法满足庞大的用户需求。特别是对于数据隐私安全及有着二次训练需求企业级用户，已经开始纷纷在本地部署满血版DeepSeek大模型。这也直接带动了市场对于AI一体机的需求。这其中，相比英伟达GPU更具性价比的国产AI芯片方案受到了市场的青睐。

国产AI一体机市场百花齐放

据不完全统计，到2025年2月，至少有20家国产芯片厂商宣布与DeepSeek展开合作，其中就包括了华为昇腾、百度昆仑芯、海光、沐曦集成电路、摩尔线程等知名AI芯片厂商。通过国产AI模型+国产AI芯片的组合，国内AI生态开始打破英伟达的CUDA生态限制，推动“国产算力+国产大模型”生态系统的建设。

华为推出的昇腾DeepSeek一体机，采用了昇腾高性能算力底座，深度融合了DeepSeek全系列大模型能力，能够满足语言理解、图像分析、知识推理等全场景应用需求。

中国电信推出的“息壤智算一体机”基于华为昇腾910B芯片，提供了全栈国产化推理服务，支持DeepSeek-R1/V3系列模型，支持全栈国产化推理服务，满足大型企业和政府机构对高稳定性和高并发性能的需求。

中国移动也发布了以国产CPU/GPU为核心的“智算一体机-DeepSeek版”，为企业提供“开箱即用”的私有化部署体验，适合快速部署AI应用。

拓维信息推出的兆瀚AI服务器也是基于昇腾芯片，主要针对政务与教育领域的高并发需求，支持DeepSeek-R1/V3全系列模型，并提供快速部署的能力。

浪潮信息则推出了基于国产GPU（如沐曦芯片）的“海若一体机”，该一体机支持DeepSeek 671B大模型的单机推理，适用于复杂决策场景；而京东云则推出了支持多种国产AI加速芯片的DeepSeek一体机，帮助企业部署更高效的AI解决方案。

百度智能云也推出了搭载昆仑芯P800的“百舸DeepSeek一体机”，具备显著的成本优势。据介绍，百度的“百舸DeepSeek一体机”支持高性能的训练与推理需求，单机高吞吐，能够满足500人团队并发使用，响应速度极快，且运维成本低。

国产沐曦GPU的特定行业总代理商超讯通信，依托沐曦GPU良好的兼容性和适配能力，近期也推出“元醒”训练推理一体机，为客户提供本地化部署全栈式DeepSeek-R1/V3解决方案。

基于沐曦GPU，超讯通信拿下14.88亿元大单

2月24日，超讯通信发布公告称，公司与深圳市星航智算科技有限公司签订《智算集成服务采购合同》，合同含税总金额约为人民币6.38亿元。采购清单包含元醒曦云C500- P PCle训推一体服务器、交换机、光纤、光模块、网线及其他、智算云平台、大模型智能体平台、大模型数据知识平台及AI应用平台。

公告称，本合同的签订及正常履行将有利于实现公司所代理的“沐曦”GPU产品和自有“元醒”品牌算力服务器的批量销售，为公司算力业务拓展带来更多的市场机会。相关销售收入的确认将随着本合同的逐步履行而分阶段进行，若本合同能全部顺利履行，将对公司未来业绩产生积极影响。

在此前的2月7日，超讯通信还曾发布公告称，公司与中特新联科技产业发展(北京)有限公司签订《采购合同》及对应《采购订单》，客户向公司采购智算集成服务，合同含税总金额约为人民币8.5亿元。合同标的主要为元醒曦云C500-P PCie训推一体服务器、交换机、光纤、光模块、网线及其他、智算云平台、大模型智能体平台、大模型数据知识平台及AI应用平台。

需要指出的是，由于DeepSeek模型大幅降低了对于算力的需求，再加上模型的开源，打破了英伟达CUDA生态束缚，使得相比英伟达GPU更具性价比的国产AI芯片方案受到了AI训推一体机市场的青睐。

一个月内，超讯通信接连拿下了合计14.88亿元的基于沐曦曦云C500芯片方案的训推一体服务器大单，足见目前该市场对于沐曦AI芯片方案的认可。

资料显示，沐曦成立于2020年的，其创始人陈维良曾任AMD全球GPGPU设计总负责人；联合创始人、CTO兼首席硬件架构师彭莉是AMD全球首位华人女科学家（Fellow），曾任AMD首席架构师，拥有15年高性能GPU设计经验；联合创始人兼软件CTO杨建博士是AMD大中华地区第一位科学家（Fellow），历任AMD、海思等首席架构师，拥有20年大规模芯片及GPU软硬件设计经验。

目前沐曦拥有用于AI推理的MXN系列GPU（曦思）；面向AI训练、AI推理及通用计算的MXC系列（曦云）通用GPU(GPGPU)芯片；针对图形渲染加速的MXG系列（曦彩）GPU。

据相关报道显示，曦云C500在2023年6月就完成芯片功能测试，该芯片采用7nm制程， GPGPU架构，目标FP32算力达到15TFLOPS，大约达到了英伟达A100（FP32性能为19.5TFLOPS）的75%的算力。同样，曦云C500也支持多卡互联。

2023年8月，沐曦发布新闻稿称，曦云C500千亿参数AI大模型训练及通用计算GPU与北京智谱华章科技有限公司开源的中英双语对话语言模型ChatGLM2-6B完成适配。测试结果显示，曦云C500在智谱AI的升级版大模型上充分兼容、高效稳定运行。

今年2月初，在DeepSeek刚刚火爆网络之时，沐曦也联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型，随后DeepSeek-R1、DeepSeek-V3 型均实现了在基于曦云GPU训推一体上成功运行。2月24日，沐曦还宣布其GPU率先跑通DeepSeek开源代码库FlashMLA。

【来源：芯智讯】

THE END

广告、内容合作请点击这里寻求合作

国产GPU AI

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

国产GPU斩获14.88亿元AI训推一体机大单

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们