谷歌的尴尬:Gemini搜索能力被指不如Claude,开发者实测遇“幻觉”翻车

近日,开发者社区Linux.do的一则讨论引发了关于AI模型搜索能力的关注。一位开发者在测试中发现,谷歌旗下的Gemini模型在回答关于特定命令行工具`agy-cli`的问题时,存在严重的“幻觉”现象。该模型未有效联网检索信息,而是自信地输出了错误的配置参数,导致用户被误导。与之形成鲜明对比的是,竞争对手Anthropic的Claude在面对不确定性问题时,表现出了更谨慎的检索机制,通过利用搜索能力来弥补知识盲区,从而提供更准确的回答。这一案例不仅暴露了Gemini在实时信息获取和事实核验方面的短板,也引发了业界对于“搜索巨头谷歌为何没能做好AI搜索”的广泛讨论。对于开发者而言,AI模型的准确性与可靠性直接影响工作效率,Gemini此次的表现令人失望,也凸显了RAG(检索增强生成)技术在AI应用中的关键作用。

事件分析

从技术架构来看,大语言模型在处理垂直领域或冷门项目时,受限于训练数据的截断和覆盖率,极易出现幻觉。此次事件的核心在于模型对于“确定性”的边界控制差异。Claude展现出的是一种更成熟的工具调用策略,即当内部知识库无法支撑回答时,倾向于触发搜索机制;而Gemini在当前的交互模式中,似乎更倾向于基于概率生成文本,而非严格的事实核查。这反映了谷歌在整合其传统搜索优势与大模型生成能力时可能存在的割裂感。对于开发者工具而言,模型的“知之为知之,不知为不知”比单纯的生成能力更为重要。

💡 核心观点:搜索起家的谷歌其AI却在“懂搜索”上落后,这不仅是技术短板,更是传统搜索向生成式AI转型阵痛的缩影。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册