一位开发者利用 VSCode 插件,对包括 DeepSeek、Kimi、GPT、Gemini 及 Claude 在内的国内外主流大模型进行了代码生成能力横评。测试统一要求模型在不查阅外部文件的情况下,编写一个带有动态效果的 HTML 单页自我介绍。结果显示,Claude 4.7 Opus 版本表现尤为惊艳,不仅生成的页面效果流畅,更在思考过程中体现出主动规避特定颜色配对(如紫黑)的‘意识’,引发了关于模型审美偏好与安全训练机制的讨论。
原文链接:Linux.do
一位开发者利用 VSCode 插件,对包括 DeepSeek、Kimi、GPT、Gemini 及 Claude 在内的国内外主流大模型进行了代码生成能力横评。测试统一要求模型在不查阅外部文件的情况下,编写一个带有动态效果的 HTML 单页自我介绍。结果显示,Claude 4.7 Opus 版本表现尤为惊艳,不仅生成的页面效果流畅,更在思考过程中体现出主动规避特定颜色配对(如紫黑)的‘意识’,引发了关于模型审美偏好与安全训练机制的讨论。
原文链接:Linux.do
评论前必须登录!
立即登录 注册