近日,科技社区发现DeepSeek似乎已悄然上线多模态能力。用户实测反馈显示,模型在处理图像相关任务时表现稳健,引发了对DeepSeek是否已部署原生多模态架构的猜测。此前DeepSeek凭借R1模型在推理性能上惊艳业界,此次若证实具备视觉理解能力,标志着其正迅速构建“文本+视觉”的完整AGI拼图,有望在极短时间内对现有的闭源多模态巨头(如GPT-4o)发起新一轮冲击。
原文链接:Linux.do
近日,科技社区发现DeepSeek似乎已悄然上线多模态能力。用户实测反馈显示,模型在处理图像相关任务时表现稳健,引发了对DeepSeek是否已部署原生多模态架构的猜测。此前DeepSeek凭借R1模型在推理性能上惊艳业界,此次若证实具备视觉理解能力,标志着其正迅速构建“文本+视觉”的完整AGI拼图,有望在极短时间内对现有的闭源多模态巨头(如GPT-4o)发起新一轮冲击。
原文链接:Linux.do
评论前必须登录!
立即登录 注册