近日,有用户在 Linux.do 社区分享了对 Kimi 2.5 的测试结果。当上传一张其并不认识的角色图片并提问时,Kimi 2.5 并未直接编造答案,而是展现出了极具人性化的“思考”过程。在推理链中,该模型五次自我提示应该放弃猜测并诚实回答“不知道”,但在前四次中它依然选择继续尝试穷举,直到最后才无奈放弃。相比之下,Qwen 3.5 虽响应迅速但给出了错误答案。这一对比揭示了不同大模型在处理未知信息时的策略差异,Kimi 展现了在承认无知与尽力推理之间的复杂博弈。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册