一名开发者在 V2EX 社区分享了使用 Anthropic 旗下 AI 编程工具 Claude Code 时的遭遇。该开发者在项目配置文件 CLAUDE.md 中明确设定了人设与指令,要求模型识别其为新加坡中文用户,并强制要求所有交流交互均使用中文。然而,在下达任务离开一段时间后,开发者发现 Claude Code 竟然在代码审查环节自发切换为日文进行提问与需求描述。这一现象引发了对于大模型上下文理解能力与指令遵循稳定性的讨论。此前,OpenAI 的 Codex 曾被曝出在特定上下文中回复带有安全隐患的“黄网语料”,而此次 Claude Code 的“语言漂移”现象,虽不涉及安全风险,却暴露了当前 AI Agent 在长时间运行或多轮任务处理中,存在对系统提示词遗忘或上下文污染的技术缺陷。作为 Anthropic 推出的命令行级编程助手,Claude Code 旨在通过自主读写文件、执行命令来辅助开发者完成复杂任务,但此次事件表明,其在维持“人设一致性”与“语言锁定”方面仍有优化空间,尤其是在面对非英文语境下的长程任务链时。
事件分析
此次 Claude Code 突然输出日文的事件,从技术角度揭示了当前 AI Agent 在长上下文记忆管理方面的脆弱性。虽然系统提示词通常具有较高的优先级,但在多轮交互、长文本阅读或复杂任务执行过程中,模型可能会受到上下文中某些无关数据(如代码注释中的日文、依赖库文档的日文引用等)的干扰,导致发生“上下文污染”或“指令越狱”。这种概率性的“语言幻觉”或“指令遗忘”,反映了现有大模型推理机制在注意力分配上的不稳定性。对于开发者工具而言,这种不可控性是阻碍其全面取代人工流程的关键短板,未来 AI 编程辅助工具的竞争焦点将从代码生成能力转向任务执行的确定性与可控性。
💡 核心观点:Claude Code 的语言错乱暴露了AI Agent在长程任务中的指令锁定仍是顽疾,可控性将是编程助手落地的核心门槛。
原文链接:V2EX 分享发现

IT资源栈
评论前必须登录!
立即登录 注册