In the Land of AI Agents, the Verifiers Are King 这场分享来自 AI Engineer World’s Fair 2026 Day 2 主舞台,讲者是 Tariq Shaukat。本文只整理会议内容和分享脉络,不做个人使用心得。
原视频:https://www.youtube.com/watch?v=4sX_He5c4sI(约 00:36:20 开始)
分享内容
Tariq Shaukat 代表 Sonar 做的分享,主题是代码验证。相比前一场 Fable 的探索性,他把讨论拉回工程纪律:agent 越能生成,越需要验证者。因为模型输出越来越流畅,人类更容易在审查时放松警惕,把看起来正确的东西当成真的正确。
这场分享的核心框架是 Guide、Verify、Solve。Guide 是先把任务、规则、约束和质量标准讲清楚;Verify 是把静态分析、测试、代码质量规则和证据收集放进循环;Solve 才是让 agent 去改代码。顺序很重要,如果先让 agent solve,再事后找验证,团队很容易变成替模型错误补理由。
字幕里提到一个很醒目的数字:Guide、Verify、Solve 这套方法可以带来 92% 的问题减少。这个数字的意义,不在于把它当成通用承诺,而在于说明验证前置和验证后置之间的差距。模型同样能写代码,但流程有没有验证栅栏,会直接影响坏结果留下来的概率。
Tariq 还把问题和代码质量连接起来。agentic development 不是让 clean code 过时,而是让 clean code 更重要。代码越清楚、复杂度越低、规则越稳定,agent 越容易理解上下文,也越容易被验证工具抓住问题。技术债在机器速度下会放大。
分享结构
这场分享的结构比较清楚:先用 In the Land of AI Agents, the Verifiers Are King 的问题背景引入,再把重点落到 Software Factories 这条主线。讲者不是只给一个结论,而是把问题、机制、案例和边界分开讲,方便听众判断这个方向能不能进入真实系统。
按内容顺序看,第一层是背景:Tariq Shaukat 代表 Sonar 做的分享,主题是代码验证。相比前一场 Fable 的探索性,他把讨论拉回工程纪律:agent 越能生成,越需要验证者。因为模型输出越来越流畅,人类更容易在审查时放松警惕,把看起来正确的东西当成真的正确。 第二层是方法或案例:这场分享的核心框架是 Guide、Verify、Solve。Guide 是先把任务、规则、约束和质量标准讲清楚;Verify 是把静态分析、测试、代码质量规则和证据收集放进循环;Solve 才是让 agent 去改代码。顺序很重要,如果先让 agent solve,再事后找验证,团队很容易变成替模型错误补理由。 这两层决定了这场分享不是单纯概念介绍,而是在解释为什么这个问题现在变得重要。
第三层是工程约束:字幕里提到一个很醒目的数字:Guide、Verify、Solve 这套方法可以带来 92% 的问题减少。这个数字的意义,不在于把它当成通用承诺,而在于说明验证前置和验证后置之间的差距。模型同样能写代码,但流程有没有验证栅栏,会直接影响坏结果留下来的概率。 这部分通常是会议分享里最值得保留的内容,因为它说明方案不是靠一句口号成立,而是靠具体环境、指标、记忆、验证或工具链支撑。
关键细节集中在后半段:Tariq 还把问题和代码质量连接起来。agentic development 不是让 clean code 过时,而是让 clean code 更重要。代码越清楚、复杂度越低、规则越稳定,agent 越容易理解上下文,也越容易被验证工具抓住问题。技术债在机器速度下会放大。 这段把分享从背景介绍推进到可检查的技术抓手,也解释了为什么它会被放进 Day 2 的主舞台议程。
会议脉络
这场在 Day 2 的位置很关键。自动研究和 agent loop 都会产生大量候选结果,如果没有验证纪律,这些候选只会增加审查负担。Sonar 的分享等于给后面的 autoresearch 加了一条底线:研究循环必须知道自己什么时候错了。
会议里的其他分享也不断回到同一点。Sakana 讲 memory harness,Arena 讲真实世界 eval,Aiden 讲公开记录,GEPA 讲从失败轨迹里学习。Tariq 这场最早把这些内容归到一个工程原则里:生成只是开始,验证才决定能不能积累。
这场分享不是反对 agent,而是反对没有验证的 agent。它的实际含义是,AI 编程系统要把验证写进默认路径,而不是作为上线前的补丁。代码生成越便宜,拒绝坏代码的系统越值钱。
来源说明
本文依据官方日程、YouTube 自动英文字幕和视频时间线整理。长直播中存在等待音乐、主持人口播和少量插播内容,正文只保留对应主舞台分享的有效信息。









评论前必须登录!
立即登录 注册