谷歌发布T5Gemma 2:新一代多模态长上下文编码器-解码器模型

谷歌近日发布T5Gemma 2,这是基于Gemma 3架构的新一代编码器-解码器模型。相比前代产品,T5Gemma 2引入了多项架构创新,包括绑定的词嵌入和合并的注意力机制,显著减少了模型参数量。新模型支持多模态处理能力,能够同时理解和处理图像与文本;上下文窗口扩展至128K tokens,大幅提升长文本处理能力;支持140多种语言,具有强大的多语言处理能力。性能测试显示,T5Gemma 2在多模态、长上下文、编码和推理等任务上均超越前代产品。该系列提供270M-270M、1B-1B和4B-4B三种规模的预训练模型,适用于设备端应用和下游任务开发。目前模型已在Kaggle、Hugging Face等平台开放下载,为AI研究者和开发者提供了强大的新工具

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册