Autoresearch for Kernels 这场分享来自 AI Engineer World’s Fair 2026 Day 2 主舞台,讲者是 Tejas Bhakta。本文只整理会议内容和分享脉络,不做个人使用心得。
原视频:https://www.youtube.com/watch?v=4sX_He5c4sI(约 06:00:10 开始)
分享内容
Tejas Bhakta 的分享把 autoresearch 放到 GPU kernel 优化里。字幕里他提到自己从宿舍 GPU mining 到 Tesla inference optimization 的经历,然后把问题落到一个很工程的目标:怎样让模型和系统在 GPU 上跑得更快。
Kernel 优化天然适合自动研究,因为它有明确指标。候选方案能不能编译,结果是否正确,速度有没有提高,资源占用是否合理,这些都可以被程序检查。相比开放式产品判断,kernel search 的反馈更硬。
分享里提到 auto research 是让 agent 朝一个定义好的目标移动。在 kernel 场景里,这个目标不是一句抽象指令,而是一组测试和性能指标。agent 生成候选 kernel,系统运行验证,再根据结果决定是否保留。
这场和 Han Xiao 的 dense retrieval 分享形成对应。两者都说明,自动研究最容易落地的地方,往往是有清楚评价函数的工程问题。检索看 nDCG,kernel 看 latency、throughput 和 correctness,训练看 loss 和成本。
分享结构
这场分享的结构比较清楚:先用 Autoresearch for Kernels 的问题背景引入,再把重点落到 Autoresearch 这条主线。讲者不是只给一个结论,而是把问题、机制、案例和边界分开讲,方便听众判断这个方向能不能进入真实系统。
按内容顺序看,第一层是背景:Tejas Bhakta 的分享把 autoresearch 放到 GPU kernel 优化里。字幕里他提到自己从宿舍 GPU mining 到 Tesla inference optimization 的经历,然后把问题落到一个很工程的目标:怎样让模型和系统在 GPU 上跑得更快。 第二层是方法或案例:Kernel 优化天然适合自动研究,因为它有明确指标。候选方案能不能编译,结果是否正确,速度有没有提高,资源占用是否合理,这些都可以被程序检查。相比开放式产品判断,kernel search 的反馈更硬。 这两层决定了这场分享不是单纯概念介绍,而是在解释为什么这个问题现在变得重要。
第三层是工程约束:分享里提到 auto research 是让 agent 朝一个定义好的目标移动。在 kernel 场景里,这个目标不是一句抽象指令,而是一组测试和性能指标。agent 生成候选 kernel,系统运行验证,再根据结果决定是否保留。 这部分通常是会议分享里最值得保留的内容,因为它说明方案不是靠一句口号成立,而是靠具体环境、指标、记忆、验证或工具链支撑。
关键细节集中在后半段:这场和 Han Xiao 的 dense retrieval 分享形成对应。两者都说明,自动研究最容易落地的地方,往往是有清楚评价函数的工程问题。检索看 nDCG,kernel 看 latency、throughput 和 correctness,训练看 loss 和成本。 这段把分享从背景介绍推进到可检查的技术抓手,也解释了为什么它会被放进 Day 2 的主舞台议程。
会议脉络
Kernel 优化也暴露了自动研究的边界。agent 可以尝试很多写法,但它不能绕过正确性。速度提升如果带来错误结果,就没有价值。性能搜索必须把 correctness gate 放在最前面,否则系统会学会追求错误的快。
这场分享对 Day 2 的意义,是把 autoresearch 从“研究发现”拉到“工程优化”。很多团队不需要一开始就自动发现新算法,可以先让 agent 在可验证的性能空间里搜索。这样的任务风险更低,反馈更快,也更容易说清收益。
Tejas 的分享可以概括为:agent 适合处理大量候选,但系统必须提供硬评分。只要目标、测试和成本都清楚,底层性能优化反而是自动研究比较现实的入口。
来源说明
本文依据官方日程、YouTube 自动英文字幕和视频时间线整理。长直播中存在等待音乐、主持人口播和少量插播内容,正文只保留对应主舞台分享的有效信息。








评论前必须登录!
立即登录 注册