国产GPU斩获14.88亿元AI训推一体机大单

业界
2025
02/26
14:56
芯智讯
分享
评论

随着国产AI大模型DeepSeek的持续火爆,DeepSeek官方服务器一直是超负荷,已经无法满足庞大的用户需求。特别是对于数据隐私安全及有着二次训练需求企业级用户,已经开始纷纷在本地部署满血版DeepSeek大模型。这也直接带动了市场对于AI一体机的需求。这其中,相比英伟达GPU更具性价比的国产AI芯片方案受到了市场的青睐。

国产AI一体机市场百花齐放

据不完全统计,到2025年2月,至少有20家国产芯片厂商宣布与DeepSeek展开合作,其中就包括了华为昇腾、百度昆仑芯、海光、沐曦集成电路、摩尔线程等知名AI芯片厂商。通过国产AI模型+国产AI芯片的组合,国内AI生态开始打破英伟达的CUDA生态限制,推动“国产算力+国产大模型”生态系统的建设。

华为推出的昇腾DeepSeek一体机,采用了昇腾高性能算力底座,深度融合了DeepSeek全系列大模型能力,能够满足语言理解、图像分析、知识推理等全场景应用需求。

中国电信推出的“息壤智算一体机”基于华为昇腾910B芯片,提供了全栈国产化推理服务,支持DeepSeek-R1/V3系列模型,支持全栈国产化推理服务,满足大型企业和政府机构对高稳定性和高并发性能的需求。

中国移动也发布了以国产CPU/GPU为核心的“智算一体机-DeepSeek版”,为企业提供“开箱即用”的私有化部署体验,适合快速部署AI应用。

拓维信息推出的兆瀚AI服务器也是基于昇腾芯片,主要针对政务与教育领域的高并发需求,支持DeepSeek-R1/V3全系列模型,并提供快速部署的能力。

浪潮信息则推出了基于国产GPU(如沐曦芯片)的“海若一体机”,该一体机支持DeepSeek 671B大模型的单机推理,适用于复杂决策场景;而京东云则推出了支持多种国产AI加速芯片的DeepSeek一体机,帮助企业部署更高效的AI解决方案。

百度智能云也推出了搭载昆仑芯P800的“百舸DeepSeek一体机”,具备显著的成本优势。据介绍,百度的“百舸DeepSeek一体机”支持高性能的训练与推理需求,单机高吞吐,能够满足500人团队并发使用,响应速度极快,且运维成本低。

国产沐曦GPU的特定行业总代理商超讯通信,依托沐曦GPU良好的兼容性和适配能力,近期也推出“元醒”训练推理一体机,为客户提供本地化部署全栈式DeepSeek-R1/V3解决方案。

基于沐曦GPU,超讯通信拿下14.88亿元大单

2月24日,超讯通信发布公告称,公司与深圳市星航智算科技有限公司签订《智算集成服务采购合同》,合同含税总金额约为人民币6.38亿元。采购清单包含元醒曦云C500- P PCle训推一体服务器、交换机、光纤、光模块、网线及其他、智算云平台、大模型智能体平台、大模型数据知识平台及AI应用平台。

公告称,本合同的签订及正常履行将有利于实现公司所代理的“沐曦”GPU产品和自有“元醒”品牌算力服务器的批量销售,为公司算力业务拓展带来更多的市场机会。相关销售收入的确认将随着本合同的逐步履行而分阶段进行,若本合同能全部顺利履行,将对公司未来业绩产生积极影响。

在此前的2月7日,超讯通信还曾发布公告称,公司与中特新联科技产业发展(北京)有限公司签订《采购合同》及对应《采购订单》,客户向公司采购智算集成服务,合同含税总金额约为人民币8.5亿元。合同标的主要为元醒曦云C500-P PCie训推一体服务器、交换机、光纤、光模块、网线及其他、智算云平台、大模型智能体平台、大模型数据知识平台及AI应用平台。

需要指出的是,由于DeepSeek模型大幅降低了对于算力的需求,再加上模型的开源,打破了英伟达CUDA生态束缚,使得相比英伟达GPU更具性价比的国产AI芯片方案受到了AI训推一体机市场的青睐。

一个月内,超讯通信接连拿下了合计14.88亿元的基于沐曦曦云C500芯片方案的训推一体服务器大单,足见目前该市场对于沐曦AI芯片方案的认可。

资料显示,沐曦成立于2020年的,其创始人陈维良曾任AMD全球GPGPU设计总负责人;联合创始人、CTO兼首席硬件架构师彭莉是AMD全球首位华人女科学家(Fellow), 曾任AMD首席架构师,拥有15年高性能GPU设计经验;联合创始人兼软件CTO杨建博士是AMD大中华地区第一位科学家(Fellow),历任AMD、海思等首席架构师,拥有20年大规模芯片及GPU软硬件设计经验。

目前沐曦拥有用于AI推理的MXN系列GPU(曦思);面向AI训练、AI推理及通用计算的MXC系列(曦云)通用GPU(GPGPU)芯片;针对图形渲染加速的MXG系列(曦彩)GPU。

据相关报道显示,曦云C500在2023年6月就完成芯片功能测试,该芯片采用7nm制程, GPGPU架构,目标FP32算力达到15TFLOPS,大约达到了英伟达A100(FP32性能为19.5TFLOPS)的75%的算力。同样,曦云C500也支持多卡互联。

2023年8月,沐曦发布新闻稿称,曦云C500千亿参数AI大模型训练及通用计算GPU与北京智谱华章科技有限公司开源的中英双语对话语言模型ChatGLM2-6B完成适配。测试结果显示,曦云C500在智谱AI的升级版大模型上充分兼容、高效稳定运行。

今年2月初,在DeepSeek刚刚火爆网络之时,沐曦也联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型,随后DeepSeek-R1、DeepSeek-V3 型均实现了在基于曦云GPU训推一体上成功运行。2月24日,沐曦还宣布其GPU率先跑通DeepSeek开源代码库FlashMLA。

【来源:芯智讯】

THE END
广告、内容合作请点击这里 寻求合作
国产GPU AI
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3