近日,科技社区 Linux.do 发起了一项名为“DuckBenchmark”的纯视觉挑战,要求 AI 识别一只较为罕见的绿色返祖珂尔鸭。测试结果显示,绝大多数主流大模型(包括升级后的 Gemini 新版)纷纷“阵亡”,普遍将其误判为常见的野生绿头鸭。据反馈,目前唯一成功识别出该品种的竟然是去年的旧版 Gemini。这一测试不仅有趣,更深刻揭示了当前多模态 AI 在处理小众细分领域知识时的局限性,以及视觉特征提取上的不稳定性。
原文链接:Linux.do
近日,科技社区 Linux.do 发起了一项名为“DuckBenchmark”的纯视觉挑战,要求 AI 识别一只较为罕见的绿色返祖珂尔鸭。测试结果显示,绝大多数主流大模型(包括升级后的 Gemini 新版)纷纷“阵亡”,普遍将其误判为常见的野生绿头鸭。据反馈,目前唯一成功识别出该品种的竟然是去年的旧版 Gemini。这一测试不仅有趣,更深刻揭示了当前多模态 AI 在处理小众细分领域知识时的局限性,以及视觉特征提取上的不稳定性。
原文链接:Linux.do
评论前必须登录!
立即登录 注册