First Steps Toward Automated AI Research 这场分享来自 AI Engineer World’s Fair 2026 Day 2 主舞台,讲者是 Richard Socher。本文只整理会议内容和分享脉络,不做个人使用心得。
原视频:https://www.youtube.com/watch?v=4sX_He5c4sI(约 01:55:55 开始)
分享内容
Richard Socher 的分享是 Day 2 自动研究主题的中心之一。他提出的概念是 Eureka Machine,也就是一台最终能发明未来发明的机器。这个说法听起来很大,但分享的重点并不是科幻式 AGI,而是把科学发现拆成可被系统执行和改进的流程。
他先把问题放到经济增长和科学发现的长线里。人类进步依赖新发现,但发现过程高度依赖少数研究者的直觉、时间和实验资源。如果 AI 能参与提出假设、运行实验、分析结果,研究速度就可能改变。
Eureka Machine 需要的不只是语言模型。它还需要工具、实验环境、数据、评价指标和迭代机制。模型可以提出想法,但系统要能执行实验、读取结果、判断有没有进步,并把结果带回下一轮。
这和普通“问答式 AI”有本质区别。问答只要求模型给出一个回答,自动研究要求系统在一个目标空间里持续移动。它要记得尝试过什么,知道哪些结果失败了,还要能提出下一步。
分享结构
这场分享的结构比较清楚:先用 First Steps Toward Automated AI Research 的问题背景引入,再把重点落到 Autoresearch 这条主线。讲者不是只给一个结论,而是把问题、机制、案例和边界分开讲,方便听众判断这个方向能不能进入真实系统。
按内容顺序看,第一层是背景:Richard Socher 的分享是 Day 2 自动研究主题的中心之一。他提出的概念是 Eureka Machine,也就是一台最终能发明未来发明的机器。这个说法听起来很大,但分享的重点并不是科幻式 AGI,而是把科学发现拆成可被系统执行和改进的流程。 第二层是方法或案例:他先把问题放到经济增长和科学发现的长线里。人类进步依赖新发现,但发现过程高度依赖少数研究者的直觉、时间和实验资源。如果 AI 能参与提出假设、运行实验、分析结果,研究速度就可能改变。 这两层决定了这场分享不是单纯概念介绍,而是在解释为什么这个问题现在变得重要。
第三层是工程约束:Eureka Machine 需要的不只是语言模型。它还需要工具、实验环境、数据、评价指标和迭代机制。模型可以提出想法,但系统要能执行实验、读取结果、判断有没有进步,并把结果带回下一轮。 这部分通常是会议分享里最值得保留的内容,因为它说明方案不是靠一句口号成立,而是靠具体环境、指标、记忆、验证或工具链支撑。
关键细节集中在后半段:这和普通“问答式 AI”有本质区别。问答只要求模型给出一个回答,自动研究要求系统在一个目标空间里持续移动。它要记得尝试过什么,知道哪些结果失败了,还要能提出下一步。 这段把分享从背景介绍推进到可检查的技术抓手,也解释了为什么它会被放进 Day 2 的主舞台议程。
会议脉络
Richard 的分享也给当天其他 talk 提供了统一背景。Han Xiao 的 dense retrieval 是一个可验证的小研究空间;Sakana 的 memory harness 解决长跑过程中忘记决策的问题;W&B 的 Arya 让 agent 读真实实验 trace;Aiden 展示 agent 进入公开竞赛和社区贡献的可能。
会议里最值得注意的是,Eureka Machine 并没有被讲成单个超级模型。它更像一组环节:假设、实验、反馈、记忆和验证。任何一环缺失,系统都很难从“会生成想法”进入“能积累发现”。
这场分享给 Day 2 定下了大问题:AI 是否能参与研究过程。后续分享的价值,是把这个问题切成小块,让听众看到哪些部分已经能做,哪些部分还卡在 eval、记忆、工具和责任边界上。
来源说明
本文依据官方日程、YouTube 自动英文字幕和视频时间线整理。长直播中存在等待音乐、主持人口播和少量插播内容,正文只保留对应主舞台分享的有效信息。









评论前必须登录!
立即登录 注册