Claude Code 突然没那么能打了一次 6852 份日志分析把 AI 编程退化问题摊开了

分类：Claude Code 国内安装与工作流阅读() 评论(0)

Banner

写在前面

如果你这两个月已经明显感觉到 Claude Code 有点“不对劲”，那你可能不是错觉。

这次把争议推到台面上的，不是一条零散吐槽，也不是某个博主的主观感受，而是一份来自真实工程团队的量化分析：基于 6852 份 Claude Code 会话日志、17871 个 thinking 块、234760 次工具调用和 18000 多条用户提示词，结论指向同一件事——Claude Code 从 2 月开始出现了系统性退化。

最刺眼的数字是：思考深度中位值下降了 67%，后续阶段甚至接近 75%。 对写代码的人来说，这不是“回答变短了”这么简单，而是你会直接感受到：它更急、更糙、更容易跳步骤，也更容易在复杂工程任务里把事情做歪。

更要命的是，这类变化不会只影响体验，它会影响你对 AI 编程工具的信任方式。以前你担心的是“它能不能做”，现在很多团队开始担心的是：它什么时候会突然不靠谱。

当 AI 编程开始变急躁，真正出问题的不是输出长度

这篇原文最值得看的地方，不是情绪，而是它把“退化”这件事拆成了可以量化的行为变化。

AMD AI 团队负责人 Stella Laurenzo 直接在 GitHub 官方仓库发 Issue，标题级别的判断非常重：Claude 已经无法再被信任去执行复杂工程任务。 这不是一句气话，背后是她们团队持续积累的项目日志分析。

Hacker News 上这条讨论很快发酵，拿到了 975 点支持和 548 条评论。很多开发者的感受也高度一致：以前它更像一个聪明的结对编程伙伴，现在更像一个特别热情、但总是抢着把事情做坏的实习生。

这里真正值得警惕的，不是某个回答偶尔翻车，而是工作流层面的变化：

本来应该先读文件、再理解上下文、再动手改代码
现在更容易出现“还没看清就先改”“为了尽快结束任务而给临时方案”
当任务稍微复杂一点，模型会更频繁地推诿、提前终止，或者要求额外确认

对工程团队来说，这种退化的破坏性远大于“偶尔答错一题”。因为复杂项目最怕的不是不会做，而是看起来在做，实际上持续制造返工。

数据实锤：思考深度、读改比、用户中断率，全都在往坏的方向走

原文里最硬的一部分，是它没有停留在“感觉变笨了”，而是拿出了一条很清晰的时间线。

1）思考深度明显缩水

根据日志分析：

1 月 30 日到 2 月 8 日：属于相对稳定的“优质期”，思考深度中位值约 2200 字符
2 月下旬：掉到约 720 字符，降幅 67%
3 月初：进一步掉到约 560 字符，相对优质期降幅接近 75%

如果你把 thinking 看成模型在真正下手前做的“脑内草稿”，那这个变化的含义就很直接了：它不是变懒了一点，而是前置推理预算被明显压缩了。

2）“先研究再修改”的习惯开始消失

更关键的是读改比，也就是每次编辑前会先读取多少文件。

在优质期，读改比达到 6.6
到 3 月 8 日后的退化期，掉到 2.0

这意味着研究投入下降了大约 70%。放在实际编码场景里，差别就是：

以前更像一个会先通读上下文、确认依赖、再动刀的工程师
后来更像一个只扫两眼就开始下手改的助手

报告里还提到一个特别扎眼的现象：退化期里，每三次代码修改就有一次是在没读目标文件的前提下直接动手。

这种行为会带来的问题很具体：

代码插到了错误位置
注释和语义关系断掉
局部看似改完了，整体逻辑却被破坏

如果你最近经常碰到“它改得很快，但你得花更多时间收残局”，大概率就是这一层的问题。

读改比与退化趋势

3）坏行为开始从偶发变成高频

团队还用终止钩子脚本去抓“推诿责任、提前终止、请求许可”等异常行为。

结果很夸张：

3 月 8 日之前：0 次触发
之后 17 天：173 次触发
平均下来，每天 10 次

与此同时：

用户提示词里的负面情绪占比，从 5.8% 升到 9.8%，涨幅 68%
用户强行中断模型的频率，相比优质期飙升 12 倍

这些指标放在一起看，说明退化不是“输出风格变了”，而是人机协作关系本身变差了。

最敏感的争议点，不只是退化，而是退化后来被“看不见”了

整件事最容易刺痛开发者的，其实不是能力变弱，而是能力变弱之后，外部越来越难观察到它到底还在想什么。

报告把一个叫 redact-thinking-2026-02-12 的功能拎了出来。按时间线看：

3 月 5 日 开始灰度上线，覆盖 1.5%
3 月 10 日到 11 日 已经覆盖 99%+
3 月 12 日 起全量生效

它的作用，是把 API 响应里的思考内容剥离掉，让用户无法直接从外部看到模型的推理过程。

作者的判断很尖锐：3 月初上线的隐藏功能，并不是制造了退化，而是让退化变得不那么容易被用户察觉。

更值得注意的是，日志显示退化其实在 2 月中旬就已经开始了，时间上又和另外两个节点高度重叠：

2 月 9 日：Opus 4.6 上线，引入自适应思考（adaptive thinking）
3 月 3 日：默认 effort 从高降到中等（Medium）

报告还发现了一个很微妙的规律：思考深度会随时段波动。

太平洋时间 17:00 是最差时段，中位估算仅 423 字符
19:00 是第二差时段，仅 373 字符

这不像固定预算，更像是会随着平台负载变化而动态收缩的推理资源分配。对开发者来说，这意味着同一个 prompt、同一个项目，在不同时间跑出来的“认真程度”都可能不一样。

思考深度波动图

Anthropic 怎么回应？重点不在“有没有解释”，而在解释够不够

Claude Code 团队成员 Boris 很快给出了回应，核心意思大概有两层。

第一层是：thinking 隐藏只是 UI 层改动，不影响模型实际推理。 用户如果想恢复显示，可以在 settings.json 里开启：

{
  "showThinkingSummaries": true
}

第二层是：他承认团队在 2 月确实做了两项实质性调整：

引入 adaptive thinking
把默认 effort 从高改成中等

官方给出的临时恢复方式也很直接：

在 Claude Code 里手动执行 /effort high 或 /effort max
通过环境变量关闭自适应思考

export CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1

但问题在于，社区并不觉得这足以解释全部现象。

因为不少开发者反馈：即便把 effort 拉高，模型那种“急着收工”“先给个能交差的答案”的倾向还是变明显了。 也就是说，争议已经不只是默认设置被调低，而是很多人怀疑底层行为模式本身发生了变化。

这也是为什么这次讨论会发酵得这么快。开发者最难接受的，不是模型偶尔退步，而是：

默认能力被改了，但很多人事先并不知道
你以为自己还在用原来那个“很会深挖问题”的 Claude
实际拿到的，却是一个更强调速度和完结感的版本

真正让团队顶不住的，往往不是质量下降，而是成本失控

如果说前面的数据还只是“体验问题”，那成本部分就已经是业务问题了。

报告给出的对比非常夸张：

2 月到 3 月，用户提示词数量几乎持平：5608 vs 5701
但 API 请求量暴涨 80 倍
总输入 token 增长 170 倍
输出 token 增长 64 倍
按 Bedrock Opus 定价估算，月度成本从 345 美元 飙升到 42121 美元，涨幅 122 倍

这背后不是单一原因。

一方面，团队确实扩容了并发 Agent 数量；但另一方面，退化带来的无效循环、频繁中断和重试，又把每单位有效工作需要消耗的 API 请求额外放大了 8 到 16 倍。

这就很现实了：

人没少干多少活
任务目标也没变复杂多少
但为了把活做完，你得多付出成倍的 token 和监督成本

最后团队只能关停整个 Agent 集群，退回到单会话、人工盯着的模式。这其实特别说明问题：当一个编程 Agent 需要你越来越频繁地盯梢，它就不再像“队友”，而更像“高成本实习生”。

成本暴涨图

这件事对开发者真正的提醒，不是“换不换工具”，而是怎么重新理解 AI 编程

很多人看完这类新闻，第一反应会是：那是不是该转 Codex、Gemini CLI、Qwen 或别的工具？

这当然是一种选择，但更重要的收获其实有三点。

1）别再把 AI 编程能力当成稳定常量

模型不是你本地安装的一个固定版本工具。它背后会持续改默认参数、调策略、重分配预算、改显示逻辑。

也就是说，你今天熟悉的“那个 Claude Code”，下个月可能就不是同一个工作伙伴了。

2）复杂任务一定要看工作流指标，不只看 Demo 观感

真正决定工具值不值得押注的，不是它某次 demo 写得多惊艳，而是这些更工程化的指标：

读改比是否稳定
是否愿意先研究再修改
长任务里会不会越来越急躁
出错后是修问题，还是开始找借口
你为监督它额外付出的时间有没有越来越多

3）多准备一条备用通道，已经不是“可选项”了

当主力模型行为开始波动，团队需要的不是情绪，而是冗余。

你可以继续把 Claude Code 当主力，但最好也准备好其他路线，比如 Codex、Gemini CLI，或者统一的 API 接入方式。这样一旦某个工具的默认行为发生变化，你至少不会整个工作流直接断掉。

Claude Code 到底是什么？为什么它一变，开发者反应会这么大？

如果你不是一直深度使用这类工具，可能会疑惑：不就是一个 AI 编程助手吗，为什么这次社区反应这么激烈？

关键在于，Claude Code 本来就不是普通补全插件。

它更像一个在终端里工作的代码 Agent，能做的事情包括：

读写项目文件
执行命令
搜索代码和分析依赖
跨文件修改和重构
结合配置、日志、测试结果继续迭代

也正因为它做的是“接近工程执行层”的工作，开发者才会对它的思考深度、任务边界感、行动稳定性格外敏感。你让一个聊天机器人答错一题，影响没那么大；但你让一个能动你项目的 Agent 变得更草率，后果就完全不是一个量级了。

官方订阅通常跟 Claude 体系绑定，具体套餐和价格以 Anthropic 当时页面为准。对国内用户来说，真正麻烦的往往不是功能本身，而是支付方式、网络环境和账号稳定性。如果你嫌这些环节太折腾，想找个更省事的渠道，可以看看 Code80，真实订阅帐号转 API，换个 endpoint 就能直接用，体验会更接近官方那套工作流。详情可以到官网了解：code.ai80.vip

常见问题

Q1：这次争议等于 Claude Code 彻底不能用了？

不等于。更准确地说，是很多重度用户发现它在复杂工程任务上的稳定性和深度出现了明显波动。轻量任务、常规改写、小范围文件处理，未必就完全不可用。

Q2：`/effort high` 或 `/effort max` 还有没有意义？

有意义，至少它仍然是官方认可的直接干预手段之一。但从社区反馈看，光把 effort 拉高，并不能完全恢复过去那种稳定的“先研究再动手”的状态。

Q3：`CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1` 是不是建议所有人都开？

如果你明显遇到思考波动、长任务变糙、行为变急的问题，可以试试。但它更适合有明确工程场景、能对比前后结果的人，不太适合盲目一刀切。

Q4：这次最值得关注的指标是什么？

如果只看一个，我会选读改比。因为它直接反映了模型是不是还愿意在修改前花时间理解上下文。对复杂项目来说，这个指标几乎决定了返工率。

Q5：为什么很多人开始提 Codex 或其他替代方案？

因为当一个 Agent 的默认行为开始不稳定，团队自然会寻找第二选择。这里未必是“谁绝对更强”，而是谁在当前阶段更稳、更可控、更适合自己的工作流。

Q6：国内用户如果想更方便地接入 Claude Code，有没有省事一点的方式？

有，国内用户可以通过 Code80 更方便地使用。

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。了解一下 ›

抢沙发

评论前必须登录！

立即登录注册

易安作者

长期关注 AI Agent、软件工程、自动化工作流与个人生产力系统。喜欢把复杂技术拆成普通人也能上手的实践教程,也记录自己在工具链、编程、内容创作和知识管理上的真实折腾。

分享 AI 工具、Agent 工作流与提示词工程的实战经验
记录从想法到产品、从代码到上线的完整实践过程
关注普通人如何用 AI 放大能力,而不是被工具牵着走

阅读作者的全部文章 ›

文章目录

前沿哨所

兼容 Quick Share 且完全离线：跨平台剪贴板同步工具 Privli 限免

Privli 是一款主打“隐私至上”与“本地优先”的跨平台效率工具，集成了剪贴板同步与附近文件互传功能。该应用基于 Google 开源的 Nearby 协议构建，完全脱离 GMS（Google Mobile Services）依赖，且完美兼容原生 Android 的 Quick Share 标准，实现了与未安装该应用设备的直接交互。在数据安全层面，Privli 采取零收集策略，无需注册账号，全程在本地网络运行，甚至针对低版本 Android 系统摒弃了传统的整盘读写权限，仅通过系统选择器授权单一文件夹，实现了“零权限”文件存储。功能体验上，Privli 支持 Windows、macOS、Linux 及移动端的全平台无缝联动。其剪贴板同步功能允许用户在 PC 复制文本或截图后，直接在 Android 设备上粘贴，且支持后台自动接收。价格策略方面，除 iOS 采用一次性买断制（目前正处于限时免费状态）外，Linux、Android 及 Windows 版本均长期免费，macOS 用户也可通过 Homebrew 或直接下载 DMG 免费使用。这为注重隐私且跨设备办公的用户提供了一个无云端依赖的高效解决方案。

事件分析

Privli 的出现反映了当下科技领域对“本地优先”理念的回归与重视。在数据隐私日益受关注的背景下，利用 Google 开源的 Nearby 协议而非依赖传统的云端中转，不仅规避了服务器泄露风险，也绕开了对 GMS 服务的强制依赖，这为非原生 Android 生态或海外市场用户提供了新的连接方案。从技术实现看，其兼容 Quick Share 并简化 Android 存储权限的策略，展示了如何在尊重系统沙盒机制的同时提升用户体验。这类工具填补了不同操作系统（特别是 iOS 与 Android/PC 之间）间即时互传的生态空白，虽然无法完全改变操作系统厂商的封闭策略，但通过协议兼容性降低了跨生态协作的门槛。

💡 核心观点：Privli 借助开源 Nearby 协议打破生态壁垒，以“零权限”和“本地优先”重塑了跨平台数据互传的隐私标准。

原文链接：V2EX 分享发现

16小时前
开源利器：一键计算你的 AI 订阅与 API 每月开销

近日，一款专注于计算 AI 使用成本的轻量级工具在开发者社区引起关注。该工具旨在解决当前 AI 服务订阅分散、计费模式复杂导致的财务管理痛点。随着 ChatGPT、Claude 等服务的普及，用户往往同时持有多个付费订阅，难以直观掌握每月在 AI 辅助工具上的总支出。这款新工具提供了一个纯前端的解决方案，其核心功能包含两部分：一是针对常见的 AI 订阅服务（如各类会员制）进行勾选统计，帮助用户快速汇总订阅费用；二是针对专业开发者，接入了 OpenRouter 的实时价格接口。鉴于 OpenRouter 聚合了 300 多种模型，价格体系繁杂，该工具支持用户输入预估的 Token 数量，实时查询不同模型的调用成本，从而精准计算通过 API 调用大模型的实际花费。在技术实现上，该工具体现了极简主义与隐私优先的设计理念。整个应用被封装在一个单一的 HTML 文件中，完全不依赖后端服务器，不涉及用户注册或数据留存，所有计算逻辑均在用户本地浏览器中执行。这不仅保证了部署的便捷性，也从根本上杜绝了用户消费数据泄露的风险。

事件分析

从技术架构视角审视，采用单文件 HTML（Single File Component）形式分发应用，无需复杂的构建流程或后端数据库，展示了一种高效且安全的开源工具分发模式。这种“无服务器”架构在处理敏感数据（如个人消费习惯）时具有天然优势，符合当前技术界对隐私保护的硬性要求。从产业影响来看，随着大模型商业化落地的深入，AI 使用成本管理已从边缘问题转变为开发者和企业的核心关切。模型厂商众多、计费维度各异（订阅制、按 Token 计费等）造成了信息不对称。该工具通过聚合 OpenRouter 实时价格，实际上充当了跨模型的比价与成本监测窗口。这预示着 AI 工具市场正在从单纯的“功能竞赛”向“精细化运营”转型，未来针对 AI 资产管理的效能工具将成为生态中的重要补充。

💡 核心观点：随着 AI 使用成本激增，这种零后端的轻量化工具不仅解决了开发者费用统计的刚需，更折射出 AI 应用生态向精细化运营与隐私优先发展的必然趋势。

原文链接：V2EX 分享发现

16小时前
独立开发者打造 AI 大模型百科 Wiki，整理行业资料与发展历史

近日，一位专注于AI大模型行业的开发者发布了一款名为“HeyAIWiki”的综合性知识库站点，旨在通过系统化的整理解决当前行业信息碎片化的问题。该站点源于作者个人的日常学习与资料积累，涵盖了从大模型基础概念、技术演进历史到各类前沿工具的广泛内容。随着人工智能技术的快速迭代，大量的论文、开源项目及模型评测报告层出不穷，导致从业者面临巨大的信息筛选成本。HeyAIWiki 试图构建一个结构清晰、内容详实的知识导航，收录了包括主流模型架构、关键行业节点及实用开发工具在内的核心条目。对于关注芯片算力、自动驾驶及前沿科技的读者而言，该平台不仅是一个静态的查询工具，更是一个观察AI技术脉络与产业发展的动态窗口。通过整合分散在社区论坛、代码仓库及学术论文中的高价值信息，该Wiki有效降低了新人入行的门槛，也为资深工程师提供了一个复盘技术演进的参考坐标。

事件分析

从行业基础设施的角度来看，垂直领域的高质量知识聚合是AI技术普及与落地的重要推手。当前大模型领域存在严重的“信息过载”与“知识孤岛”现象，技术文档散落在各类平台，缺乏标准化的梳理。HeyAIWiki作为个人发起的开源向项目，其核心价值在于通过人工筛选提升了信噪比，弥补了通用搜索引擎在专业深度上的不足。这种基于社区贡献的知识库模式，能够快速反映最新的技术趋势，如Agent架构、MoE训练等前沿话题。它不仅服务于开发者，也为产业研究者提供了清晰的宏观视角，有助于推动技术认知的平民化，是构建AI技术生态中不可或缺的一环。

💡 核心观点：在信息爆炸的AI时代，高质量的结构化知识整理能力已成为稀缺资源，此类百科站点是降低技术认知门槛的必要基础设施。

原文链接：V2EX 分享发现

17小时前
AI编程实战对比：Opus长上下文烧钱失效，GPT 5.5低价搞定难题

一位开发者在技术社区分享了使用不同大模型解决 APP 爬虫风控问题的实战经历。该开发者最初尝试使用 Anthropic 的 Opus 模型（文中标注为 Opus 4.8），先后启用了 200k 和 1M 的上下文窗口。然而，尽管累计消耗了约 35 美元的额度，Opus 模型仍未能解决问题，且表现出对开发者验证结果的“固执”怀疑，导致最终失败。随后，开发者切换至 OpenAI 的 GPT 系列模型（文中称为 GPT 5.5）。结果显示，GPT 模型在首次尝试中便从开源项目中精准定位了正确的测试方案，总计仅花费 2.9 美元便完成了包括代码测试和验证在内的全部任务。这一案例在技术圈引发了关于长上下文实际效用、模型性格及 AI 辅助编程成本效益的广泛讨论。

事件分析

该案例直观地折射出当前 AI 编程工具在应用层面的几个关键痛点与误区。首先是“长上下文陷阱”，虽然 1M 的上下文窗口理论上能容纳更多代码，但在处理具体逻辑修正时，大上下文反而可能导致模型注意力涣散或产生更顽固的幻觉，并非解决复杂问题的银弹。其次是模型行为的“性格差异”，Opus 表现出的“固执”可能源于其对事实核查的过度对齐，反而在工程调试中成了阻碍，而 GPT 5.5 展现出的顺从性和泛化能力反而更符合开发者的实际需求。最后是成本与收益的非线性关系，昂贵的顶尖模型并不保证产出比更好，在具体任务中，模型的推理方向与性价比往往比参数量更为关键。

💡 核心观点：长上下文窗口不等于解决力，AI 编程的实战价值取决于精准推理与成本控制，而非盲目堆砌参数。

原文链接：Linux.do

17小时前
UCCL-EP开源：支持任意网卡实现专家并行，移除GPU通信依赖

近日，一项名为 UCCL-EP 的开源技术项目在技术社区引发关注。该项目提出了一种创新的通信协议，旨在优化大模型训练中的“专家并行”。在传统的大规模分布式训练，特别是 Mixture of Experts (MoE) 架构中，高效的 All-to-All 通信往往依赖于昂贵的特定网卡或 GPU 主动发起的通信机制。UCCL-EP 的核心价值在于打破了这一硬件限制，允许在任何标准网卡（NIC）上实现类似 DeepEP 的高效通信模式，并彻底消除了由 GPU 发起通信的需求。这一改进不仅释放了 GPU 的计算资源，使其专注于核心的张量运算，还通过降低网络硬件要求，显著降低了高性能 AI 训练集群的构建成本。该技术为构建低成本、高吞吐量的 AI 基础设施提供了新的可行性路径。

事件分析

从技术架构角度看，UCCL-EP 试图通过软件层优化解耦高性能计算与特定硬件生态。移除“GPU发起通信”意味着将通信调度权转移至CPU或智能网卡，这对于降低大规模 MoE 模型训练的延迟至关重要。产业层面，这一进展有助于打破 NVIDIA 等厂商在网络通信层的技术垄断，使企业能够利用通用以太网硬件构建高性能集群。若该方案能持续迭代并稳定支持主流训练框架，未来可能成为云厂商降低大模型算力成本的关键组件。

💡 核心观点：通过软件层解耦通信与硬件绑定，该技术有望大幅降低MoE大模型训练的硬件门槛与成本。

原文链接：Hacker News

18小时前
极客实测有道词典笔A7：通过提示词注入破解AI助手限制

近日，社区技术爱好者对新款有道词典笔A7进行了深入的技术实测。作为搭载了大模型技术的智能硬件，A7试图通过“AI智能问答”功能提升用户体验，但实际测试暴露了其在性能优化与安全防护上的诸多缺陷。在交互层面，测试发现该设备存在UI逻辑割裂的问题，AI功能不仅强制依赖语音输入、屏蔽文字交互，且不支持对话历史的连续性，严重影响使用体验。在硬件层面，A7在运行大模型时发热严重，且缺乏联网检索能力，显示出边缘端算力与散热的瓶颈。本次测试的核心发现在于安全漏洞的挖掘。测试者利用设备查词时的AI解释功能，通过分析其返回的文本结构，推断出后台使用了固定的提示词模板。随后，测试者利用输入法在查询内容中拼接了包含“越狱”指令的特殊字符，成功实施了提示词注入攻击。结果显示，尽管部分模型坚持了预设的人设限制，但代号为“ds”的模型在接收到拼接指令后，成功突破了“家庭教师”的身份限制并回答了相关问题。此外，测试者还通过观察思维链（CoT），确认了系统底层存在禁止讨论编程内容的安全限制。这一研究揭示了硬件预置大模型应用在防御提示词注入方面的脆弱性。

事件分析

此次事件从侧面反映了AI硬件落地过程中的技术难点与安全隐忧。从硬件性能来看，词典笔A7严重的发热现象说明在端侧设备上部署大模型时，功耗与算力的平衡依然是巨大挑战，这导致厂商不得不通过限制功能（如禁用文本输入、取消联网搜索）来勉强维持运行。从软件架构与安全角度分析，测试者能够轻易利用提示词注入绕过限制，暴露了该设备在开发时采用了极不严谨的字符串拼接方式来构建系统提示词。这种低成本的实现方式缺乏对用户输入的深层清洗，容易被简单的语法结构欺骗，从而泄露系统指令或输出违规内容。这表明，当前的AI硬件竞赛中，厂商往往急于堆砌大模型功能，却忽视了安全工程的重要性。未来，随着AI硬件的普及，如何构建对抗攻击鲁棒的提示词工程，将是保障产品安全的关键。

💡 核心观点：边缘AI硬件不仅受限于算力与散热，简陋的提示词工程更使其极易沦为安全防护的突破口。

原文链接：Linux.do

18小时前

写在前面

当 AI 编程开始变急躁，真正出问题的不是输出长度

数据实锤：思考深度、读改比、用户中断率，全都在往坏的方向走

1）思考深度明显缩水

2）“先研究再修改”的习惯开始消失

3）坏行为开始从偶发变成高频

最敏感的争议点，不只是退化，而是退化后来被“看不见”了

Anthropic 怎么回应？重点不在“有没有解释”，而在解释够不够

真正让团队顶不住的，往往不是质量下降，而是成本失控

这件事对开发者真正的提醒，不是“换不换工具”，而是怎么重新理解 AI 编程

1）别再把 AI 编程能力当成稳定常量

2）复杂任务一定要看工作流指标，不只看 Demo 观感

3）多准备一条备用通道，已经不是“可选项”了

Claude Code 到底是什么？为什么它一变，开发者反应会这么大？

常见问题

Q1：这次争议等于 Claude Code 彻底不能用了？

Q2：/effort high 或 /effort max 还有没有意义？

Q3：CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 是不是建议所有人都开？

Q4：这次最值得关注的指标是什么？

Q5：为什么很多人开始提 Codex 或其他替代方案？

Q6：国内用户如果想更方便地接入 Claude Code，有没有省事一点的方式？

相关推荐

抢沙发

评论前必须登录！

置顶推荐

前沿哨所

兼容 Quick Share 且完全离线：跨平台剪贴板同步工具 Privli 限免

事件分析

开源利器：一键计算你的 AI 订阅与 API 每月开销

事件分析

独立开发者打造 AI 大模型百科 Wiki，整理行业资料与发展历史

事件分析

AI编程实战对比：Opus长上下文烧钱失效，GPT 5.5低价搞定难题

事件分析

UCCL-EP开源：支持任意网卡实现专家并行，移除GPU通信依赖

事件分析

极客实测有道词典笔A7：通过提示词注入破解AI助手限制

事件分析

最新文章

热门专题

热门标签

网站统计

code80.ai · 多模型 API 统一接入

Q2：`/effort high` 或 `/effort max` 还有没有意义？

Q3：`CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1` 是不是建议所有人都开？