百度伐谋Agent 2.0登顶MLE-Bench,机器学习工程能力超越OpenAI Opus

百度智能云自主研发的伐谋Agent 2.0在机器学习工程权威基准MLE-Bench中荣获全球第一,并刷新了历史最高分。该基准由OpenAI主导设立,涵盖75个来自Kaggle的真实机器学习任务,旨在全方位评估AI模型的工程化落地能力。据报道,伐谋Agent 2.0在此次评测中表现出了超越OpenAI Opus模型的实力,标志着国产AI Agent在从理论对话向复杂工程任务执行的技术进化中取得了关键突破。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册