谷歌发布首个原生多模态嵌入模型Gemini Embedding 2

业界

2026

03/11

09:30

华尔街见闻

3月10日，谷歌DeepMind推出Gemini Embedding 2，这是该公司首个原生多模态嵌入模型，将文本、图像、视频、音频及文档统一映射至单一嵌入空间，标志着AI嵌入技术迈入全模态融合的新阶段。

Gemini Embedding 2支持超100种语言的语义理解，并在文本、图像及视频任务的基准测试中超越现有主流模型，同时引入了此前嵌入模型所欠缺的语音处理能力。

该模型现已通过Gemini API及Vertex AI进入公开预览阶段，开发者可即时接入。

对于企业用户而言，该模型的发布直接降低了构建多模态检索增强生成（RAG）、语义搜索及数据分类系统的技术门槛，有望简化此前需跨模态分别处理的复杂数据管道。

全模态统一：从文本扩展至五类媒体形式

Gemini Embedding 2基于Gemini架构构建，将嵌入能力从纯文本扩展至五类输入形式：

文本支持最多8192个输入token；

图像每次请求最多处理6张，支持PNG及JPEG格式；

视频支持最长120秒的MP4和MOV文件；

音频可直接摄入并生成嵌入向量，无需经过中间文本转录步骤；

文档则支持最多6页的PDF文件直接嵌入。

区别于逐一处理单一模态的传统方式，该模型支持交错输入，即在单次请求中同时传入图像与文本等多种模态组合，使模型能够捕捉不同媒体类型之间复杂而细微的语义关联。

Gemini Embedding 2延续了谷歌此前嵌入模型中采用的Matryoshka表示学习（MRL）技术。该技术通过"嵌套"方式动态压缩向量维度，使输出维度可从默认的3072灵活缩减，帮助开发者在模型性能与存储成本之间取得平衡。

基准测试领先，语音能力为新亮点

谷歌表示，Gemini Embedding 2在文本、图像及视频任务的基准测试中均优于当前主流竞品模型，并将其定位为多模态嵌入领域的新性能标杆。

谷歌建议开发者根据应用场景选择3072、1536或768三档维度，以获得最优质的嵌入效果。这一设计对于需要大规模部署嵌入向量的企业尤为重要，可在不显著牺牲精度的前提下有效控制基础设施成本。

在能力覆盖方面，该模型引入了此前同类模型普遍缺失的原生语音嵌入能力，无需借助语音转文字的中间环节即可直接处理音频数据。

谷歌指出，嵌入技术已广泛应用于其多款产品之中，覆盖RAG场景下的上下文工程、大规模数据管理以及传统搜索与分析场景。

目前已有部分早期访问合作伙伴开始基于Gemini Embedding 2构建多模态应用，谷歌称这些用例正在兑现该模型在高价值场景中的实际潜力。

【来源：华尔街见闻】

THE END

广告、内容合作请点击这里寻求合作

谷歌

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

相关热点

官方认可美参议院批准使用谷歌、OpenAI及微软三大A

北京时间3月11日，据《纽约时报》报道，当地时间周一，美国参议院的一名高层管理人员批准助手们在公务中使用三款AI聊天机器人。

业界

对手来帮忙 30多名OpenAI、谷歌员工力挺Anthropic起

北京时间3月10日，据《连线》杂志报道，30多名OpenAI、谷歌员工在周一提交了一份法庭之友意见书，以支持Anthropic与美国政府的法律斗争，其中包括谷歌旗下DeepMind首席科学家杰夫·迪恩(Jeff Dean)。

业界

谷歌授予CEO皮查伊高达6.92亿美元薪酬方案绩效考核

北京时间3月7日，据《金融时报》报道，谷歌将在未来三年把CEO桑达尔·皮查伊(Sundar Pichai)的总潜在薪酬提高至6.92亿美元，使其成为世界上薪酬最高的CEO之一。

业界

苹果在中国抽成何时能降！谷歌宣布应用商店降低抽成

3月6日消息，谷歌母公司Alphabet今日正式宣布，将对其Google Play应用商店的抽成比例进行大幅下调。这一举措标志着移动应用市场竞争格局的一次重大转型。

业界

谷歌发布Gemini 3.1 Flash-Lite：首字响应提速2.5倍

3 月 4 日消息，谷歌昨日（3 月 3 日）发布博文，宣布推出轻量级 AI 模型 Gemini 3.1 Flash-Lite，声称是其速度最快、最具成本效益的 Gemini 3 系列模型。

业界

华尔街见闻

华尔街见闻是中国领先的金融信息和商业资讯提供商，首创金融信息和商业资讯“实时”模式，重要信息秒级推送，...

谷歌发布首个原生多模态嵌入模型Gemini Embedding 2

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们