DeepSeek 视觉模型实测:地图与图像联想能力表现出色,多模态比拼 Gemini

近日,社区针对 DeepSeek 视觉模型进行了首轮实测,并将其与 Gemini 3.1 Pro、Kimi 等主流模型进行了横向对比。测试项目涵盖手指数量识别、军事装备细节(如直10毫米波雷达)、冷门航空知识、地图常识以及图像联想能力。结果显示,DeepSeek 在地图笑话测试中表现完美,成功识别新西兰与南极洲,而 Gemini 则出现严重幻觉;在图像联想和“开盒”能力上,DeepSeek 也展现了强大潜力。不过,DeepSeek 在基础手指识别(4指)和极冷门概念图识别上存在失误。总体而言,DeepSeek 视觉模型在多模态领域已具备极强的竞争力,但在细节捕捉上仍有优化空间。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册