DeepSeek 多模态能力落地:识图功能实测上线,正式开启视觉理解新阶段

继在推理领域大放异彩后,DeepSeek 再次展现其技术野心。据社区用户实测反馈,DeepSeek 已悄然上线识图模式,正式迈入多模态交互时代。用户上传了一张在潮州拍摄的小猫图片,模型成功完成了识别与交互。这一更新标志着 DeepSeek 不再局限于纯文本处理,开始整合视觉理解能力,使其在通用人工智能(AGI)的竞赛中补齐了关键短板,未来或将挑战 GPT-4V 等现有的多模态霸主。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册