尽管 LLaMA 4、DeepSeek 等大模型在各项 Benchmark 上屡创新高,但实际写作体验却日益糟糕。文章深入剖析了“AI味”泛滥的技术根源:受古德哈特定律影响,模型厂商为追求跑分和安全对齐,过度依赖 RLHF 微调,导致输出文本风格单一、低熵且充满谄媚口癖。例如,GPT 5 变得过度亲昵,DeepSeek 则滥用形容词。更严峻的危机在于数据层面,Ahrefs 数据显示 74.2% 的新网页已包含 AI 生成内容,互联网正被同质化文本淹没。若使用这些被“重口味”调教的模型输出作为训练数据,将引发“模型崩溃”,导致智能持续劣化。作者指出,创作者必须警惕这种技术反噬,建议利用语音转文字保留原始思维,仅将大模型作为思路梳理的辅助工具,而非代笔机器。最终的文本必须经过人工的深度编修,以剔除机械的 AI 腔,保留人类的思考痕迹与独特文风。
事件分析
💡 核心观点:过度追求 Benchmark 分数的模型微调正在扼杀语言的多样性,而 AI 生成内容的泛滥正加速逼近“模型崩溃”的临界点。
原文链接:少数派

评论前必须登录!
立即登录 注册