科技社区近日针对DeepSeek、GLM-5.1及Gemini三大AI模型进行了一场硬核编程测试。挑战要求各模型使用Three.js生成一个包含移动、跳跃及方块交互功能的简易版《我的世界》。测试结果显示,GLM-5.1表现最佳,完全遵循指令但略显卡顿;DeepSeek实现了核心功能但出现按键逻辑反转;Gemini则因物理引擎Bug导致严重穿模。这一实测直观展示了当前主流大模型在处理复杂3D逻辑和代码生成方面的真实水平与差异。
原文链接:Linux.do
科技社区近日针对DeepSeek、GLM-5.1及Gemini三大AI模型进行了一场硬核编程测试。挑战要求各模型使用Three.js生成一个包含移动、跳跃及方块交互功能的简易版《我的世界》。测试结果显示,GLM-5.1表现最佳,完全遵循指令但略显卡顿;DeepSeek实现了核心功能但出现按键逻辑反转;Gemini则因物理引擎Bug导致严重穿模。这一实测直观展示了当前主流大模型在处理复杂3D逻辑和代码生成方面的真实水平与差异。
原文链接:Linux.do
评论前必须登录!
立即登录 注册