开源神器上架:利用多模态大模型API实现网页图片“沉浸式”翻译

一款名为“llm-image-translator”的开源浏览器插件正式上架Chrome商店。该工具直击现有翻译软件只能处理文本的痛点,允许用户接入自有的多模态大模型API(如Qwen、xAI等),对网页内的教程图、产品说明及文档配图进行高质量翻译并回填。它完美补全了沉浸式翻译等工具的视觉短板,支持自定义模型与排除特定网站。尽管其在漫画翻译的语气处理上尚存不足,但“自带API”的模式不仅降低了长期使用成本,也展示了大模型在浏览器端的巨大落地潜力。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册