近日,有科技社区网友在测试热门的AI生图提示词(将文章转为卡通信息图)时发现,使用Google Gemini生成的图片中,本应是文字的部分变成了无法识别的“西夏文”或乱码符号。尽管提示词逻辑清晰,但AI模型在处理图像中的具体文字语义时仍存在显著缺陷,无法准确还原中英文内容,引发了关于大模型图像生成中文字渲染能力的讨论。
原文链接:Linux.do
近日,有科技社区网友在测试热门的AI生图提示词(将文章转为卡通信息图)时发现,使用Google Gemini生成的图片中,本应是文字的部分变成了无法识别的“西夏文”或乱码符号。尽管提示词逻辑清晰,但AI模型在处理图像中的具体文字语义时仍存在显著缺陷,无法准确还原中英文内容,引发了关于大模型图像生成中文字渲染能力的讨论。
原文链接:Linux.do
评论前必须登录!
立即登录 注册