英伟达近期发布了 Nemotron-Cascade-2-30B-A3B 模型,官方宣称其性能强劲,多项指标超越月之暗面 Kimi k2.5 的 Thinking 模型。然而,有开发者针对其前端工程能力进行了实测,要求该模型生成符合 iOS 18 风格的天气卡片代码。实测结果显示,尽管该模型在基准测试中表现优异,但在具体的代码生成与 UI 交互实现上,经过多次运行效果均较差,暴露了该模型在复杂编程任务和垂直领域应用中的短板。
原文链接:Linux.do
英伟达近期发布了 Nemotron-Cascade-2-30B-A3B 模型,官方宣称其性能强劲,多项指标超越月之暗面 Kimi k2.5 的 Thinking 模型。然而,有开发者针对其前端工程能力进行了实测,要求该模型生成符合 iOS 18 风格的天气卡片代码。实测结果显示,尽管该模型在基准测试中表现优异,但在具体的代码生成与 UI 交互实现上,经过多次运行效果均较差,暴露了该模型在复杂编程任务和垂直领域应用中的短板。
原文链接:Linux.do
评论前必须登录!
立即登录 注册