一项针对 OpenRouter 集成模型的编码能力横向测评显示,在构建“高性能前端表格”的实战任务中,模型间表现差异巨大。Gemini 3.1 Pro 表现惊艳,以 93/100 的成绩成为唯一接近完美交付的模型;Gemini 3.0 Flash 虽主体可用但存瑕疵,获 69 分。反观 Hunter Alpha 和 Healer Alpha,得分均不足 50 分,尽管 UI 结构尚可,但核心算法逻辑存在严重缺陷。这表明在处理高复杂度工程代码时,头部模型仍具备显著的统治力,而部分新晋模型在实际落地中仍显稚嫩。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册