赛博斗蛐蛐实测:五款国产大模型博弈论对决,Qwen-3.5展现顶级逻辑计算能力

一位技术博主模拟了游戏《弥留之际的爱丽丝》中的天平游戏,让Qwen-3.5、GLM-4、Kimi、豆包及DS-3.2五款主流AI大模型进行厮杀。在激烈的博弈对局中,Qwen-3.5表现最为惊艳,在决胜局通过精确计算各种可能性,成功预判并利用规则完成了对GLM-4的“绝杀”;相比之下,GLM-4在绝境中则出现了逻辑混乱与“胡言乱语”。这场趣味实验生动地揭示了当前国产大模型在复杂逻辑推理、规则理解及高压环境稳定性上的真实差异。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册