我国人工智能技术产业近来取得显著进步,多款新发布的大模型已达到国际先进水平。我国AI芯片企业也在积极行动,和各国产大模型开展适配,共同构建智能计算产业生态。作为国家权威技术验证平台,中国信息通信研究院依托“人工智能芯片测试评估公共服务平台”,构建了AI芯片与大模型协同适配的标准化体系,为产业链上下游深度合作提供关键支撑,并开展AI芯片与大模型的适配验证工作,通过多项举措促进AI芯片与大模型的协同发展。
经中国信息通信研究院检测,摩尔线程自主研发的训推一体计算卡摩尔线程MTT S4000和杭州深度求索人工智能基础技术研究有限公司研发的DeepSeek-R1 671B大模型,在推理场景下的适配结果符合“AI芯片和大模型通过性适配要求”,成功通过中国信通院《AI芯片和大模型适配能力通过性评测软硬件环境及测试细则》推理场景验证。摩尔线程MTT S4000可实现正常、稳定运行,满足推理使用需求,符合通过性适配验证条件,并获颁检测证书。目前,摩尔线程系列训推一体计算卡正在开展优化性适配验证工作,相关结果将在检测流程结束后另行公布。
MTT S4000 是基于摩尔线程全功能GPU架构,专为大模型打造的训推一体通用计算卡,支持 FP64/FP32/TF32/FP16/BF16/INT8 等完整计算精度,配备48GB 高性能显存。凭借摩尔线程自研MTLink1.0技术,MTT S4000可实现多卡互联及千卡集群部署,为千亿参数大模型的训练、微调和推理提供强劲算力支撑。同时,它还兼具先进的图形渲染、视频编解码和超高清8K HDR显示能力,可满足人工智能、科学计算、多媒体处理等复合场景需求。
MTT S4000此次能够快速完成DeepSeek R1-671B大模型的适配验证,主要得益于包括vLLM_MUSA推理框架、MUTLASS、Triton-MUSA等在内的完善的MUSA生态软件栈和快捷开发实践。这些技术优势既体现了MUSA软件栈的高效适配能力,也使其整体性能达到行业主流水平,彰显了摩尔线程在国产GPU技术创新和生态建设方面的强大实力。
近期,摩尔线程还推出了搭载MTT S4000的MCCX DeepSeek大模型一体机,该产品深度融合国产全功能GPU、深度优化的高性能推理引擎和软件栈,全面支持从蒸馏版到671B参数全量版DeepSeek模型的部署需求,可灵活适配广泛的行业、场景和应用。通过摩尔线程硬件到软件的自主技术链,该一体机可实现开箱即用、安全可控的一站式大模型服务,从而为政企客户提供高效易用的国产化AI基础设施,显著降低大模型应用门槛。