近日,一项针对主流大模型手写文字提取能力的对比测试引发关注。测试对比了 Qwen 3.6 Plus、GPT、Llama 3.1 及豆包专家等多款模型。结果显示,Qwen 在识别潦草手稿时表现优异,不仅准确提取了内容,甚至自主添加了正确的概念注解(即“加戏”),相比之下 GPT 在该任务上表现糟糕。虽然 Qwen 存在过度推断的问题,但其在视觉和多模态理解上的深度令人印象深刻,显示了国产模型在实用场景下的强劲潜力。
原文链接:Linux.do
近日,一项针对主流大模型手写文字提取能力的对比测试引发关注。测试对比了 Qwen 3.6 Plus、GPT、Llama 3.1 及豆包专家等多款模型。结果显示,Qwen 在识别潦草手稿时表现优异,不仅准确提取了内容,甚至自主添加了正确的概念注解(即“加戏”),相比之下 GPT 在该任务上表现糟糕。虽然 Qwen 存在过度推断的问题,但其在视觉和多模态理解上的深度令人印象深刻,显示了国产模型在实用场景下的强劲潜力。
原文链接:Linux.do
评论前必须登录!
立即登录 注册