英伟达 Nemotron 模型实测:宣称超越 Kimi,前端代码生成却严重翻车

英伟达近期发布了 Nemotron-Cascade-2-30B-A3B 模型,官方宣称其性能强劲,多项指标超越月之暗面 Kimi k2.5 的 Thinking 模型。然而,有开发者针对其前端工程能力进行了实测,要求该模型生成符合 iOS 18 风格的天气卡片代码。实测结果显示,尽管该模型在基准测试中表现优异,但在具体的代码生成与 UI 交互实现上,经过多次运行效果均较差,暴露了该模型在复杂编程任务和垂直领域应用中的短板。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册