Qwen 3.6 Plus 实测表现:手写识别能力碾压 GPT,但 AI 为什么总爱“加戏”?

近日,一项针对主流大模型手写文字提取能力的对比测试引发关注。测试对比了 Qwen 3.6 Plus、GPT、Llama 3.1 及豆包专家等多款模型。结果显示,Qwen 在识别潦草手稿时表现优异,不仅准确提取了内容,甚至自主添加了正确的概念注解(即“加戏”),相比之下 GPT 在该任务上表现糟糕。虽然 Qwen 存在过度推断的问题,但其在视觉和多模态理解上的深度令人印象深刻,显示了国产模型在实用场景下的强劲潜力。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册