一项针对主流大模型代码生成能力的趣味测试近日引发关注。测试者试图通过Prompt让AI编写H5代码,实现“三刀将苹果切成八块”且支持视角移动的3D动画。实测结果显示,包括Grok、Gemini、Kimi、DeepSeek及Copilot在内的主流模型均在此任务中“翻车”,无法正确处理复杂的空间几何逻辑。尽管Claude在特定条件下勉强完成,但也面临高成本和耗时过长的问题。这一现象深刻揭示了当前多模态大模型在处理3D空间关系和精确交互逻辑时的局限性,显示AI尚未具备从自然语言直接转化为复杂工程代码的稳定能力。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册