腾讯发布星脉网络2.0:大模型训练效率相比上代提升20%

业界
2024
07/02
11:30
IT之家
分享
评论

7 月 2 日消息,腾讯昨日发布其自研星脉网络 2.0 版本,升级后的星脉网络支持单集群 10 万卡组网,网络通信效率比上一代提升 60%,大模型训练效率提升 20%,故障定位从天级降低至分钟级。

IT之家获悉,腾讯自研交换机从 25.6T 升级到 51.2T,容量提升一倍;自研硅光模块从 200G 升级到 400G,速率提升一倍;搭载自研算力网卡;整机通信带宽 3.2T,为业界最高。

腾讯自研全新通信协议 TiTa2.0 的部署位置从交换机转移到了网卡上,拥塞算法也从被动拥塞算法升级为主动拥塞控制算法,将星脉网络的通信效率提升 30%,让大模型的训练效率提升 10%。

腾讯全新高性能集合通信库 TCCL2.0 采用 NVLINK+NET 异构并行通信,实现数据的并行传输。Auto-Tune Network Expert 自适应算法可以根据机型、网络规模、模型算法等差异,自动调整数据包分割大小、匹配算法等参数。星脉网络通信性能提升 30%,让大模型的训练效率再提升 10%。

▲ 数据的并行传输(腾讯云)

▲ 数据的并行传输(腾讯云)

TiTa 与 TCCL 升级带来的效果叠加,让星脉网络的通信效率共提升 60%,大模型训练效率共提升 20%。

【来源:IT之家

THE END
广告、内容合作请点击这里 寻求合作
腾讯
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

9 月 16 日消息,据IT之家小伙伴投稿,腾讯的《暗区突围》手游现已上架鸿蒙 AppGallery 应用商店。
业界
9 月 9 日消息,《英雄联盟手游》鸿蒙版已于 8 月 6 日开启万人抢先体验,玩家可前往 HarmonyOS 5 游戏中心进行预约或抢先体验。
业界
9 月 1 日消息,腾讯 QQ 今晚通过官微对“米哈游告腾讯 9 月 5 日在深圳开庭”一事作出回应:“本次诉讼系米哈游因自身民事诉讼需要,希望调取相关 QQ 用户资料,但根据保护用户隐私的相关法律规定,腾讯...
业界
5月30日消息,日前,DeepSeek R1模型迎来重磅升级,正式发布DeepSeek-R1-0528全新版本。
业界
5月28日,腾讯混元团队联合腾讯音乐天琴实验室正式发布并开源语音数字人模型HunyuanVideo-Avatar。
业界

相关推荐

1
3