AMD推出完全开源的3B参数语言模型Instella,媲美Llama-3.2-3B和Qwen2.5-3B

业界
2025
03/06
15:31
IT之家
分享
评论

3月6日消息,AMD今日宣布,为Radeon RX 9070系列开源Linux驱动程序,还宣布开源Instella —— 一个完全开源的3B参数语言模型。

AMD Instella代表“完全开源的尖端30亿参数语言模型(LMs)”。这些模型在AMD Instinct MI300X GPU上进行了训练,根据AMD发布的数据,其性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等相媲美。

AMD Instella模型是在Instinct MI300X硬件上从头开始训练的,并且宣称是完全开源的:

完全开源和可访问:模型权重、训练超参数、数据集和代码的完全开源发布,促进人工智能社区内的创新与合作。

IT之家附开源地址如下:

https://github.com/AMD-AIG-AIMA/Instella

【来源:IT之家

THE END
广告、内容合作请点击这里 寻求合作
AMD
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

3 月 4 日消息,AMD 于 2 月 28 日正式发布 RDNA 4 图形架构,并推出 Radeon RX 9000 系列的全新力作 AMD Radeon RX 9070 XT 和 RX 9070 显卡。
业界
3 月 3 日消息,X 平台消息人士 Everest (@Olrak29_) 注意到,第三方海关信息数据库 NBD 记录到了多条有关 AMD "Aerith Plus" 处理器的信息。
业界
2月27日消息,AMD在CES 2025上推出了针对不同人群的Zen5芯片,包括低预算的Krackan Point、主流的Strix Point以及高端的Strix Halo。
业界
2月20日消息,Intel目前深陷财务和产品危机,从行业到政府各方都在出谋划策,但大部分都是类似的思路:要么卖掉、合资晶圆厂,要么整体都卖掉,而且据说感兴趣的巨头也不少,但毕竟是Intel,谁都不敢轻易...
业界
2月11日消息,阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)近日宣布任命新的董事会,AMD CEO苏姿丰(Lisa Su)作为新成员加入。
业界

相关推荐

1
3