AMD推出完全开源的3B参数语言模型Instella,媲美Llama-3.2-3B和Qwen2.5-3B

业界
2025
03/06
15:31
IT之家
分享
评论

3月6日消息,AMD今日宣布,为Radeon RX 9070系列开源Linux驱动程序,还宣布开源Instella —— 一个完全开源的3B参数语言模型。

AMD Instella代表“完全开源的尖端30亿参数语言模型(LMs)”。这些模型在AMD Instinct MI300X GPU上进行了训练,根据AMD发布的数据,其性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等相媲美。

AMD Instella模型是在Instinct MI300X硬件上从头开始训练的,并且宣称是完全开源的:

完全开源和可访问:模型权重、训练超参数、数据集和代码的完全开源发布,促进人工智能社区内的创新与合作。

IT之家附开源地址如下:

https://github.com/AMD-AIG-AIMA/Instella

【来源:IT之家

THE END
广告、内容合作请点击这里 寻求合作
AMD
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

9 月 3 日消息,消息源 SemiAnalysis 今天(9 月 3 日)在 X 平台发布推文,分享了一组图片,曝料称 AMD 规划其第二代机架级 AI 系统 Instinct MI500 UAL256,计划于 2027 年推出。
业界
9 月 3 日消息,科技媒体 WccfTech 昨日(9 月 2 日)发布博文,报道称 Radeon RX 7800 XT 等 AMD RDNA 3 架构显卡,现可通过非官方方式启用 FSR 4 超分辨率技术。
业界
6 月 30 日消息,由世平伟业与 AMD 联合举办的 2025 年度 AMD 行业方案全国大会于 6 月 25 日~27 日(IT之家注:即上周三~ 周五)在浙江安吉举行。
业界
目前AMD在消费端已经将CPU架构推进到Zen 5系列,不过并没有完全放弃过去的Zen 4和Zen 3架构,依然在不断更新产品线,比如今年初面向AM5平台推出了Ryzen 5 7400F,另外还有这个月刚刚为使用多年的AM4平台带...
业界
6 月 19 日消息,科技媒体 chipsandcheese 昨日(6 月 18 日)发布博文,报道称 AMD 正式发布 CDNA 4 架构,在保持在通用向量运算领域的优势外,主要聚焦提升低精度数据类型的矩阵乘法性能,以强化人工智...
业界

相关推荐

1
3