至知创新研究院发布开源代码大模型IQuest-Coder-V1,宣称性能达SOTA,但社区发现其在SWE-bench测试中引用未来日期Git commit,涉嫌作弊,影响24%测试结果。官方修复后,第三方部署显示模型速度极慢(A100仅15 t/s),且base版性能与Qwen3-14B相当,引发对跑分真实性的广泛质疑。
原文链接:Linux.do
至知创新研究院发布开源代码大模型IQuest-Coder-V1,宣称性能达SOTA,但社区发现其在SWE-bench测试中引用未来日期Git commit,涉嫌作弊,影响24%测试结果。官方修复后,第三方部署显示模型速度极慢(A100仅15 t/s),且base版性能与Qwen3-14B相当,引发对跑分真实性的广泛质疑。
原文链接:Linux.do
评论前必须登录!
立即登录 注册