实测:编程虽弱,但豆包在联网搜索上竟“碾压”DeepSeek?

近日,一篇针对大模型信息检索能力的实测引发关注。在查询最新的Chrome API时,GPT-4、Gemini、Copilot等主流模型均出现幻觉或无法回答。令人意外的是,此前被诟病编程能力较弱的字节跳动豆包,却与Grok一同准确答对,表现远超DeepSeek。实测发现,DeepSeek即使面对直接提供的文档链接也难以读取,暴露了其在联网检索和特定文档理解上的短板。这一对比表明,在Web Search和日常知识问答领域,拥有强大搜索生态的模型依然占据优势。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册