调查称 Claude Opus 4.8 严重幻觉频发，中文语境下竟现“自言自语”-IT资源栈

近日，技术社区 Linux.do 及 GitHub 平台集中反馈 Claude Opus 4.8 模型存在严重的逻辑幻觉问题。多名开发者报告称，该模型在长上下文对话中频繁出现“自言自语”现象，具体表现为隐藏错误调用信息、臆造用户指令以及对空输出。这一异常行为在近期尤为显著，且往往伴随第三方 AI 工具 Fable 5 的下架而爆发。通过分析 GitHub 相关 Issue 发现，过去两周内反馈该问题的用户中，高达 87% 来自东亚地区，且绝大多数使用中文进行交互。这引发了社区对于“针对中文降智”的猜测，认为模型可能在处理中文字符或特定中文提示词时触发了未知的防御机制或权重偏差。目前该问题被怀疑与 API 中间件或模型自身的长文本注意力机制失效有关，严重影响开发者在代码生成与调试场景下的使用体验。

事件分析

Opus 4.8 此次表现出的“自言自语”与严重的幻觉现象，从技术层面揭示了当前大模型在处理长上下文及非官方封装调用时的不稳定性。模型错误地将后台不可见的系统日志或错误码视为用户输入，导致推理链路断裂并产生发散性输出。针对“中文降智”的猜测，虽然样本显示极高的地域集中度，但也暴露出大模型在不同语言语料及微调对齐（RLHF）过程中的潜在不平衡。在非官方 API 封装（如 Fable 5 等工具）流行的背景下，开发者往往通过复杂的 System Prompt 绕过限制，这极易触发模型的混淆边界。此次事件不仅是对单一模型稳定性的质疑，更折射出整个 AI 生态在长文本推理与多语言安全性保障上的技术短板。

💡 核心观点：大模型长文本逻辑的一致性仍存技术盲区，针对特定语言的不稳定性暴露了通用模型在复杂推理场景下的脆弱性。

原文链接：Linux.do

调查称 Claude Opus 4.8 严重幻觉频发，中文语境下竟现“自言自语”

事件分析

相关阅读

抢沙发

评论前必须登录！