面对现有AI基准测试日趋饱和的挑战,谷歌DeepMind CEO Demis Hassabis宣布Kaggle推出全新“游戏竞技场”。该项目于2月2日正式上线,引入扑克(一对一)和狼人杀等非完全信息博弈,并同步升级国际象棋排行榜。此举旨在通过高复杂度的游戏环境,客观衡量AI模型在不确定性条件下的规划能力与决策水平,为评估大模型的真实推理能力提供了新的客观标准。
原文链接:Linux.do
面对现有AI基准测试日趋饱和的挑战,谷歌DeepMind CEO Demis Hassabis宣布Kaggle推出全新“游戏竞技场”。该项目于2月2日正式上线,引入扑克(一对一)和狼人杀等非完全信息博弈,并同步升级国际象棋排行榜。此举旨在通过高复杂度的游戏环境,客观衡量AI模型在不确定性条件下的规划能力与决策水平,为评估大模型的真实推理能力提供了新的客观标准。
原文链接:Linux.do
评论前必须登录!
立即登录 注册