Closing Keynote 这场分享来自 AI Engineer World’s Fair 2026 Day 2 主舞台,讲者是 Addy Osmani。本文只整理会议内容和分享脉络,不做个人使用心得。
原视频:https://www.youtube.com/watch?v=4sX_He5c4sI(约 07:48:00 开始)
分享内容
Addy Osmani 的 closing keynote 把 Day 2 的技术讨论拉回到人的位置。字幕里反复出现 edge、judgment、answerability 和 signature。模型能做的事情越来越多,人的问题就变成:哪些决定必须有人负责。
他用了一个 decay test。速度会衰减,recall 会进入 harness,verification 会进入 eval、静态检查和模型 critique,taste 也会在模型学到更多偏好后被压缩。很多今天看起来稀缺的技能,会被模型和工具持续降价。
但 signature 的半衰期更长。signature 不是签名装饰,而是谁站在最终结果背后。agent 可以选择、路由、合并、升级权限,也可以在 policy 内执行,但 execution 和 responsibility 是两回事。
这段和当天的自动研究主题并不冲突。前面所有分享都在扩大 agent 的行动边界:它能探索、能读 trace、能优化参数、能跑实验、能参与社区协作。Addy 提醒的是,行动边界扩大以后,责任边界更要清楚。
分享结构
这场分享的结构比较清楚:先用 Closing Keynote 的问题背景引入,再把重点落到 Autoresearch 这条主线。讲者不是只给一个结论,而是把问题、机制、案例和边界分开讲,方便听众判断这个方向能不能进入真实系统。
按内容顺序看,第一层是背景:Addy Osmani 的 closing keynote 把 Day 2 的技术讨论拉回到人的位置。字幕里反复出现 edge、judgment、answerability 和 signature。模型能做的事情越来越多,人的问题就变成:哪些决定必须有人负责。 第二层是方法或案例:他用了一个 decay test。速度会衰减,recall 会进入 harness,verification 会进入 eval、静态检查和模型 critique,taste 也会在模型学到更多偏好后被压缩。很多今天看起来稀缺的技能,会被模型和工具持续降价。 这两层决定了这场分享不是单纯概念介绍,而是在解释为什么这个问题现在变得重要。
第三层是工程约束:但 signature 的半衰期更长。signature 不是签名装饰,而是谁站在最终结果背后。agent 可以选择、路由、合并、升级权限,也可以在 policy 内执行,但 execution 和 responsibility 是两回事。 这部分通常是会议分享里最值得保留的内容,因为它说明方案不是靠一句口号成立,而是靠具体环境、指标、记忆、验证或工具链支撑。
关键细节集中在后半段:这段和当天的自动研究主题并不冲突。前面所有分享都在扩大 agent 的行动边界:它能探索、能读 trace、能优化参数、能跑实验、能参与社区协作。Addy 提醒的是,行动边界扩大以后,责任边界更要清楚。 这段把分享从背景介绍推进到可检查的技术抓手,也解释了为什么它会被放进 Day 2 的主舞台议程。
会议脉络
分享里一个重要区分是,agent 可以 follow runbook,但不能 inherit consequences。系统出错时,问题不是“模型为什么这样做”就结束,而是要追问谁理解了 policy、谁批准了权限、谁接受了风险、谁负责修复流程。
这也解释了为什么验证、trace 和 eval 在 Day 2 反复出现。它们不只是技术工具,也是责任工具。没有记录和证据,人类无法对自动化结果负责;没有责任边界,系统越自动,事故越难复盘。
Addy 这场给整天内容做了收束:AI 工程师的工作会继续上移。手工执行会被压缩,单次技巧会变便宜,长期留下来的能力是定义目标、设计系统、承担判断,并让错误能被追责和修正。
来源说明
本文依据官方日程、YouTube 自动英文字幕和视频时间线整理。长直播中存在等待音乐、主持人口播和少量插播内容,正文只保留对应主舞台分享的有效信息。









评论前必须登录!
立即登录 注册