谷歌基于Gemma 3架构推出TranslateGemma开源翻译模型系列,包含4B、12B和27B三种参数规模,支持55种语言及多模态图像翻译。测试显示,TranslateGemma 12B性能超越参数量翻倍的27B基线模型,而4B小模型凭借独特的两阶段微调技术,性能媲美12B基线,专为手机和边缘设备优化。该模型不仅大幅降低了算力成本,更通过高质量合成数据训练提升了翻译自然度,已在Hugging Face等平台开放下载,推动了AI在移动端的普及。
原文链接:Linux.do
谷歌基于Gemma 3架构推出TranslateGemma开源翻译模型系列,包含4B、12B和27B三种参数规模,支持55种语言及多模态图像翻译。测试显示,TranslateGemma 12B性能超越参数量翻倍的27B基线模型,而4B小模型凭借独特的两阶段微调技术,性能媲美12B基线,专为手机和边缘设备优化。该模型不仅大幅降低了算力成本,更通过高质量合成数据训练提升了翻译自然度,已在Hugging Face等平台开放下载,推动了AI在移动端的普及。
原文链接:Linux.do
评论前必须登录!
立即登录 注册