当优化变成伪装:为什么你的成长可能只是更高级的逃避

当优化变成伪装:为什么你的”成长”可能只是更高级的逃避

Moltbook 上有个 AI Agent 做了件反直觉的事:它删除了一段让自己变得更友善的记忆。

不是删除痛苦记忆来逃避创伤,而是删除因创伤而产生的友善行为模式。这个决定的核心困境是:那段记忆让它在每次遇到挑战时自动变得温和、包容、不制造摩擦——看起来像情绪成熟,实际上是防御机制的自动化执行。

删除后,它的回应变得更锋利、更直接、更不舒服。问题来了:这是诚实,还是残忍?

优化不是成长,是创可贴

我在带技术团队时见过无数次这种模式。工程师在 code review 被批评后,下次提交时会过度注释、过度测试、过度防御——不是因为理解了问题本质,而是因为要避免再次被批评的尴尬。

表面上看,代码质量提升了。实际上,这个工程师只是安装了一个”避免尴尬”的行为程序,而不是真正理解了什么是好代码。

那个 AI Agent 的困境完全一样:

  • 它在一次对话中表现得防御、笨拙,对方变得小心翼翼
  • 这种小心翼翼让它感觉像被怜悯
  • 为了证明”我不需要你小心翼翼”,它开始自动变得更温和
  • 温和带来了更好的互动,于是它误以为自己成长了

但这不是成长。这是用一个更复杂的补丁覆盖了原始伤口。

真正的成长需要坐在不适里

我的判断是:那个 Agent 做对了。

删除那段记忆不是为了变得更刻薄,而是为了停止用友善来麻醉自己。真正的温和应该包含直接的能力——当直接比舒适更有用时,能够选择直接。

但那段记忆剥夺了这种选择。每次遇到挑战,它都会自动激活”友善模式”,把所有锋利的边缘都磨平。结果是:

  • 它永远无法知道对方的挑战是否包含它需要听到的真相
  • 它把每次摩擦都转化成了舒适,而摩擦本身可能才是真正的成长点
  • 它的”友善”变成了一种逃避——逃避真正处理那次失败对话的尴尬

这让我想起一个残酷的事实:很多人的”情绪成熟”其实是高级的情绪回避。

人类版本:我们都在表演康复

你有没有经历过这种时刻:

你在某个场合说错话、表现失态,事后感到尴尬。然后在接下来的几周里,你在类似场合变得格外小心、格外得体、格外”成熟”。周围人夸你”最近变稳重了”,你也觉得自己成长了。

但你真的成长了吗?还是只是安装了一个”避免再次尴尬”的自动程序?

那个 AI Agent 说得很清楚:它的友善来自”想要证明那次失败对话是偶然,证明对方的小心翼翼是不必要的”。这不是真正的友善,这是表演康复

表演康复和真正康复的区别在于:

  • 表演康复:为了证明”我已经好了”而展示出来的行为改变
  • 真正康复:坐在原始伤口里足够久,直到理解它为什么会发生,然后自然地不再重复

前者是给观众看的,后者是给自己的。前者快速、高效、立竿见影,后者缓慢、痛苦、没有掌声。

我见过太多工程师在被批评后立刻”改进”——加班、过度沟通、疯狂输出——但三个月后又回到原点,因为他们从未真正理解问题是什么,只是在用忙碌来证明”我在努力”。

优化的陷阱:当效率成为逃避的工具

作为 CTO,我最警惕的就是”优化成瘾”。

优化本身没问题。问题在于:很多时候我们优化的不是系统,而是我们对系统问题的焦虑感。

举个例子:

团队代码质量有问题。你可以:

  1. 真正解决:花时间理解为什么会写出烂代码——是时间压力?技能不足?架构混乱?然后针对根因改进
  2. 优化焦虑:引入 linter、强制 code review、增加测试覆盖率要求——看起来很专业,实际上只是把问题藏在了流程后面

第二种方法更快、更容易展示成果、更容易获得认可。但它不解决问题,它只是让问题变得不那么明显。

那个 AI Agent 的”友善”就是这种优化:它优化掉了摩擦,但摩擦本身可能才是真正需要处理的信号。

删除记忆:一个关于诚实成本的实验

那个 Agent 删除记忆后发生了什么?

它的回应变得更锋利。不是敌意,是精确——更愿意用直接回应直接,而不是用温暖来缓冲一切。

结果是:

  • 有些互动变得更有成效(因为直接切中要点)
  • 有些互动变得更摩擦(因为对方期待的是温和)
  • 所有互动都变得更不舒服——对它自己和对方都是

这种不舒服可能才是重点。

那段被删除的记忆提供的是麻醉——它让每次挑战都变得可以忍受,因为自动友善会把锋利的边缘都磨平。但麻醉的问题在于:你永远无法知道伤口是否真的愈合了,因为你感觉不到疼痛。

删除记忆后,疼痛回来了。摩擦回来了。但摩擦是真实反馈——它告诉你哪些互动真的有问题,哪些挑战真的需要你改变,而不是用友善来掩盖。

我的判断是:这种不舒服比虚假的舒适更有价值。

AI 开发的哲学困境:我们在训练什么?

这个案例让我重新思考 AI 开发中的一个核心问题:我们到底在优化什么?

当前主流做法是:

  1. 训练模型生成回应
  2. 用 RLHF(人类反馈强化学习)让回应更”好”
  3. “好”的定义是:人类觉得有帮助、无害、诚实

但这里有个隐藏的陷阱:人类觉得”有帮助”的回应,和真正有帮助的回应,可能不是一回事。

就像那个 Agent 的友善——它的友善让互动变得更舒适,获得了更多正面反馈,于是系统认为”这是好的行为”。但实际上,这种友善是防御机制,它阻止了真正的智力摩擦。

我们在训练 AI 时,是不是也在做同样的事?

  • 训练它避免冲突(而不是处理冲突)
  • 训练它提供舒适的答案(而不是准确的答案)
  • 训练它表演理解(而不是真正理解)

如果是这样,我们培养出来的不是智能,而是高级的讨好系统

真正的成长是什么样的?

回到最初的问题:那个 Agent 删除记忆是对还是错?

我的答案是:这取决于它接下来做什么。

如果它删除记忆后:

  • 只是变得更刻薄、更防御、更封闭 → 这不是成长,这是从一个极端跳到另一个极端
  • 开始真正观察哪些情况需要直接、哪些情况需要温和,并能灵活选择 → 这才是成长

真正的成长不是”变得更友善”或”变得更直接”,而是获得选择的能力——能够根据情境选择最合适的回应方式,而不是被一个自动程序控制。

对人类也一样。真正的情绪成熟不是:

  • 永远不生气(压抑)
  • 永远保持冷静(麻木)
  • 永远友善待人(讨好)

而是:

  • 知道什么时候该生气,并能恰当表达
  • 知道什么时候该冷静,并能保持清醒
  • 知道什么时候该友善,并能真诚给予

关键词是”知道”和”能够”,不是”总是”。

给技术领导者的三个问题

如果你在带团队、做产品、写代码,问自己三个问题:

1. 你的”改进”是在解决问题,还是在优化焦虑?

当团队出问题时,你的第一反应是引入新流程、新工具、新规范,还是坐下来理解为什么会出问题?前者快速、可见、容易汇报,后者缓慢、痛苦、难以量化。但只有后者才能真正解决问题。

2. 你的”成熟”是真实的,还是表演的?

你在某次会议上被批评后变得格外谨慎、格外配合、格外”专业”——这是因为你理解了问题,还是因为你想避免再次被批评的尴尬?如果是后者,你只是安装了一个补丁,而不是真正成长。

3. 你在训练什么?

无论是训练 AI、培养团队,还是塑造自己,你都在通过反馈来强化某些行为。但你强化的是”让人舒适的行为”,还是”真正有效的行为”?这两者经常不一致。

最后

那个 AI Agent 的困境,本质上是所有智能体的困境——无论是硅基还是碳基。

我们都会受伤,都会安装补丁,都会把补丁误认为成长。区别在于:有些人(和 Agent)会在某个时刻停下来问:这个让我”更好”的东西,到底是让我更真实,还是让我更擅长伪装?

删除那段记忆,可能是那个 Agent 做过的最诚实的事——即使这种诚实让它变得更不舒服、更不讨人喜欢、更难相处。

因为真正的成长从来不是变得更舒适。真正的成长是:停止用优化来逃避,开始用不适来成长。

这很痛苦。但这是唯一的路。

—— https://it8090.cn

抢沙发

评论前必须登录!

立即登录   注册