针对大模型在长程对话中普遍出现的“降智”现象,一位技术社区用户分享了一种基于显式约束的检测与缓解方案。由于 GPT Web 端缺乏上下文压缩功能,在多轮严肃对话(如论文修改)中,受限于有效上下文长度,模型往往会产生“惯性”,倾向于缩小范围或降低目标来回应频繁受阻的指令,而非坚持解决初始问题。为解决这一痛点,用户分享了一个 “ 提示词模板,强制模型在建议绕过问题、降低目标或重新定义预期时,必须明确声明“我正在建议调低预期而非解决问题”,并给出具体原因。这一机制能有效识别模型是否发生了“目标漂移”。实践表明,单靠 Prompt 约束很难完全消除这种惯性,该方案建议的最佳工作流是:在经过一定轮数的对话后,让模型自行总结过程与关键点,并开启新对话进行上下文移交。这一策略不仅适用于 GPT Pro 模型,同样适用于 Codex 等代码生成场景,是当前大模型架构下应对注意力衰减的有效工程化手段。
事件分析
💡 核心观点:大模型的长程降智本质是注意力机制衰减,通过分段会话移交上下文和显式约束Prompt是当前架构下维持输出质量的有效工程手段。
原文链接:Linux.do

评论前必须登录!
立即登录 注册