Self-Improvement of Context, Harness, and Model Weights through Reflective Optimization 这场分享来自 AI Engineer World’s Fair 2026 Day 2 主舞台,讲者是 Lakshya Agrawal。本文只整理会议内容和分享脉络,不做个人使用心得。
原视频:https://www.youtube.com/watch?v=4sX_He5c4sI(约 05:35:05 开始)
分享内容
Lakshya Agrawal 的分享围绕 reflective optimization。问题是,AI 系统怎样从完整轨迹里反思失败,并把反思转成可执行的改进。传统方法常常依赖大量 rollouts 和梯度更新,而这场分享强调文本本身也是一种学习媒介。
GEPA 是这条路线的代表。官方描述里说,它在多个任务上比 GRPO 高到 20%,同时使用的 rollouts 少到 35 倍。这个对比说明,系统不是单靠多试,而是利用轨迹里的推理、工具调用和错误信息,生成更有针对性的文本改进。
GEPA 优化的对象可以是 prompt、agent 行为、上下文,也可以扩展到更广的 text parameters。后面的 optimize_anything 把它推广成统一 API,用自然语言定义目标和 fitness function,让系统优化不同领域里的文本控制面。
分享里还提到 Fast-Slow Training。fast channel 用文本上下文快速吸收任务细节,slow weights 则通过训练巩固更通用的推理能力。这个设计把 prompt/harness 和模型权重的更新放在同一个框架里讨论。
分享结构
这场分享的结构比较清楚:先用 Self-Improvement of Context, Harness, and Model Weights through Reflective Optimization 的问题背景引入,再把重点落到 Autoresearch 这条主线。讲者不是只给一个结论,而是把问题、机制、案例和边界分开讲,方便听众判断这个方向能不能进入真实系统。
按内容顺序看,第一层是背景:Lakshya Agrawal 的分享围绕 reflective optimization。问题是,AI 系统怎样从完整轨迹里反思失败,并把反思转成可执行的改进。传统方法常常依赖大量 rollouts 和梯度更新,而这场分享强调文本本身也是一种学习媒介。 第二层是方法或案例:GEPA 是这条路线的代表。官方描述里说,它在多个任务上比 GRPO 高到 20%,同时使用的 rollouts 少到 35 倍。这个对比说明,系统不是单靠多试,而是利用轨迹里的推理、工具调用和错误信息,生成更有针对性的文本改进。 这两层决定了这场分享不是单纯概念介绍,而是在解释为什么这个问题现在变得重要。
第三层是工程约束:GEPA 优化的对象可以是 prompt、agent 行为、上下文,也可以扩展到更广的 text parameters。后面的 optimize_anything 把它推广成统一 API,用自然语言定义目标和 fitness function,让系统优化不同领域里的文本控制面。 这部分通常是会议分享里最值得保留的内容,因为它说明方案不是靠一句口号成立,而是靠具体环境、指标、记忆、验证或工具链支撑。
关键细节集中在后半段:分享里还提到 Fast-Slow Training。fast channel 用文本上下文快速吸收任务细节,slow weights 则通过训练巩固更通用的推理能力。这个设计把 prompt/harness 和模型权重的更新放在同一个框架里讨论。 这段把分享从背景介绍推进到可检查的技术抓手,也解释了为什么它会被放进 Day 2 的主舞台议程。
会议脉络
这场和 Day 2 的自动研究主线非常贴合。自动研究不能只是失败后重跑。它需要知道失败在哪里,把失败压缩成经验,再更新下一轮可用的上下文、策略或模型参数。GEPA 提供的是“失败到改进”的中间层。
从工程角度看,GEPA 最先落地的地方可能不是训练模型权重,而是优化 prompt、skill、policy、memory rule 这些文本层参数。它们可读、可回滚、上线成本低,也更适合普通团队试验。
这场分享的重点,是把自我改进从神秘概念拆成轨迹、反思、文本参数和评估。只要每轮运行有记录、有反馈、有 fitness function,系统就有机会把失败变成下一轮的改动。
来源说明
本文依据官方日程、YouTube 自动英文字幕和视频时间线整理。长直播中存在等待音乐、主持人口播和少量插播内容,正文只保留对应主舞台分享的有效信息。









评论前必须登录!
立即登录 注册