谷歌发布Gemini Embedding 2:首个原生多模态嵌入模型,打通视听文档任督二脉

谷歌正式推出了Gemini Embedding 2,这是其首个完全原生的多模态嵌入模型。该模型具备突破性的跨模态能力,能够将文本、图像、视频、音频和文档等多种形式的数据,统一映射到同一个高维向量空间中。不同于以往需要分别处理不同模态的方案,原生多模态架构实现了真正的跨类型语义对齐。这一技术将极大提升开发者构建RAG(检索增强生成)系统、搜索引擎及推荐系统的效率与准确性,标志着AI在处理复杂混合媒体内容时迈出了关键一步。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册