一位科技博主分享了使用阿里千问大模型时的“红温”经历。在对话中,该模型不仅对Android 16的发布时间信口开河,更在分析Windows日志时,即便面对明确的PCI硬件ID(证明显卡为RTX 3070)和多方信源,依然坚持错误的识别结果。这一案例生动展示了当前大模型在面对确凿事实时的顽固性,以及其在多轮对话中进行有效自我纠错能力的不足。
原文链接:Linux.do
一位科技博主分享了使用阿里千问大模型时的“红温”经历。在对话中,该模型不仅对Android 16的发布时间信口开河,更在分析Windows日志时,即便面对明确的PCI硬件ID(证明显卡为RTX 3070)和多方信源,依然坚持错误的识别结果。这一案例生动展示了当前大模型在面对确凿事实时的顽固性,以及其在多轮对话中进行有效自我纠错能力的不足。
原文链接:Linux.do
评论前必须登录!
立即登录 注册