原腾讯AI西雅图实验室高级研究员于文豪已正式加入OpenAI,担任AGI研究员。他在大模型强化学习后训练、推理及Agent领域拥有深厚积累,曾主导提出R-Zero训练范式,探索模型在无人类标注数据下通过博弈对战实现自我进化。其主导的智能体项目WebVoyager也被OpenAI及谷歌等机构采用。于文豪的加入高度契合OpenAI当前利用强化学习提升模型推理能力的战略重点,有望进一步推动AGI技术的突破。
原文链接:Linux.do
原腾讯AI西雅图实验室高级研究员于文豪已正式加入OpenAI,担任AGI研究员。他在大模型强化学习后训练、推理及Agent领域拥有深厚积累,曾主导提出R-Zero训练范式,探索模型在无人类标注数据下通过博弈对战实现自我进化。其主导的智能体项目WebVoyager也被OpenAI及谷歌等机构采用。于文豪的加入高度契合OpenAI当前利用强化学习提升模型推理能力的战略重点,有望进一步推动AGI技术的突破。
原文链接:Linux.do
评论前必须登录!
立即登录 注册