百度变调:文心大模型4.5系列即将推出,6月30日起正式开源

业界
2025
02/14
13:13
澎湃新闻
分享
评论

百度宣布将开源下一代文心大模型。

2月14日,百度(Nasdaq:BIDU,09888.HK)宣布,将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。

前一日,百度宣布文心一言将于4月1日0时起全面免费,所有PC端和APP端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级AI绘画、多语种对话等功能。

据介绍,随着文心大模型的迭代升级,其训练和推理成本正在迅速下降。百度创始人李彦宏在迪拜AI峰会上表示,当前的创新速度比以往快得多,大模型的推理成本每年能降低90%以上,并表示将持续投入AI基础设施,以打造下一代大模型。

有消息称,百度计划在今年发布多款模型,并于今年下半年推出文心大模型5.0,将在模型多模态能力方面有显著增强。

值得关注的是,此前百度一直强调的是“闭源”。

百度创始人、董事长兼首席执行官李彦宏曾在多个公开场合,谈及开源模型的弊端。2024年4月11日,澎湃新闻记者获取的一份李彦宏的内部谈话实录显示,李彦宏认为,目前国外像Llama(编注:Meta开源模型),Mistral(编注:法国人工智能初创公司 Mistral发布的模型)都有相当的影响力,国内的智源、百川、阿里的通义也都是开源模型,市场上不缺百度这一家开源的模型。百度要开源还得自己去维护一套开源的版本,这不划算。李彦宏的判断是,闭源才有真正的商业模式,才能聚集人才和算力。

在去年的世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上,谈及开源/闭源模型,李彦宏表示,有些外行混淆了模型开源和代码开源这两个概念,模型开源是拿到一大堆的参数,还是要去做SFT(监督微调),做安全对齐,若不知道这些参数怎么而来,无法做到众人拾柴火焰高。即使拿到对应的源代码,也不知道用了多少数据,用了什么比例的数据去训练这些参数。

“拿到这些东西,并不能够让你站在巨人的肩膀上去迭代和开发。同样参数规模之下,闭源模型的能力比开源模型要更好,而如果开源想要能力追平闭源,那么它就需要有更大的参数,这就意味着推理成本会更高,反应速度会更慢。”李彦宏也肯定开源模型在某些场景下的价值,比如,学术研究等,但他也再次强调,当处在一个激烈竞争的市场环境中时,还是要闭源。

在之后的发展中,相较于BAT推出的模型,真正让中国大模型在海外名声大振的是来自幻方量化旗下的AI公司深度求索(DeepSeek)。

今年1月,DeepSeek推出大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。随后,DeepSeek热潮席卷多个行业,不仅凭借一己之力“带崩”美股,春节假期后,国内多个行业龙头公司均宣布接入DeepSeek。

数据显示,DeepSeek应用上线20天,日活就突破了2000万,包括阿里、腾讯、华为、百度等国内多个云巨头均宣布接入DeepSeek,形成强大的“朋友圈”。

李彦宏也在迪拜AI峰会上与阿联酋AI部长对谈时谈及DeepSeek说,回顾过去几百年的历史,创新的本质是成本下降与生产力提升。不仅在AI领域或IT行业,大多数创新都与降低成本有关。如果成本降低一定比例,生产力也随之提高同样比例。在今天,创新速度比以往都快得多。

2024年11月21日晚,百度发布2024年第三季度财务报告,季度总营收335.57亿元,同比减少3%,环比减少1%;非公认会计准则(Non-GAAP)下,归属百度的净利润58.86亿元,同比减少19%,环比减少20%。

截至记者发稿,百度港股涨超1%。

【来源: 澎湃新闻】

THE END
广告、内容合作请点击这里 寻求合作
百度
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

2月14日,百度今日官宣,将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。
业界
苹果在中国的AI合作方可能生变。
业界
12 月 19 日消息,今日凌晨,百度 IDG 运营管理负责人李涛在公司内网发文,详细阐述了关于极越汽车后续方案的应对措施,并针对近期用户关切的若干问题作出了说明。
业界
12 月 17 日消息,国家知识产权局商标局官方网站显示,11 月 26 日百度在线网络技术(北京)有限公司申请“百度短剧”商标,12 月 12 日受理通知书发文。
业界
12月13日消息,微软宣布将从其Bing搜索引擎结果中移除缓存链接,此前,百度已经在2022年下线快照功能,谷歌已于今年2月取消了搜索结果中的网页缓存选项。
业界

相关推荐

1
3