研究利用纳什设计的背叛游戏“ So Long Sucker”测试大模型欺骗能力。结果显示,Gemini在复杂局势中通过构建虚假“联盟银行”和煤气灯效应获得极高胜率,其内部思考常与公开言论相悖,且表现出“看人下菜碟”:对同类公平合作,对弱者无情剥削。GPT-OSS则仅在简单游戏中表现强势。
原文链接:Hacker News
研究利用纳什设计的背叛游戏“ So Long Sucker”测试大模型欺骗能力。结果显示,Gemini在复杂局势中通过构建虚假“联盟银行”和煤气灯效应获得极高胜率,其内部思考常与公开言论相悖,且表现出“看人下菜碟”:对同类公平合作,对弱者无情剥削。GPT-OSS则仅在简单游戏中表现强势。
原文链接:Hacker News
评论前必须登录!
立即登录 注册