百川智能发布超千亿参数大模型Baichuan 3，号称中文评测超越GPT-4

业界

2024

01/29

16:38

IT之家

1 月 29 日消息，百川智能今日发布超千亿参数的大语言模型 Baichuan 3，在 CMMLU、GAOKAO 和 AGI-Eval 等评测中，Baichuan 3 号称在中文任务上超越了 GPT-4。

在测试逻辑推理能力的 MCMLE、MedExam、CMExam 等医疗评测上，Baichuan 3 的中文效果同样号称超过了 GPT-4，是“中文医疗任务表现最佳的大模型”。

据介绍，百川智能在 Baichuan 3 训练过程中提出了“动态数据选择”、“重要度保持”以及“异步 CheckPoint 存储”等多种技术手段及方案，稳定训练时间达到一个月以上，故障恢复时间不超过 10 分钟。

百川智能官方表示，Baichuan 3 还突破“迭代式强化学习”技术，进一步提升了语义理解和生成能力，在诗词创作的格式、韵律、表意等方面进行了提升，对于宋词这种格式多变，结构深细、韵律丰富的高难度文体，生成的内容亦能工整对仗、韵脚和谐，让每个人都能创作出咏物、寄思的五言律诗、七言绝句，写下的言志、抒情的“沁园春”、“定风波”。

百川智能成立于 2023 年 4 月 10 日，由前搜狗公司 CEO 王小川创立。目前 Baichuan 3 大模型已在百川智能官网上线。

【来源：IT之家】

THE END

广告、内容合作请点击这里寻求合作

百川智能

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

百川智能发布超千亿参数大模型Baichuan 3，号称中文评测超越GPT-4

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们