一位开发者在实际开发MES系统时深度测试了Kimi k2.5模型。尽管依托Fireworks平台获得了极高的推理速度(200 TPS),但模型在实际编码表现中令人失望。主要问题集中在:需求理解阶段擅自捏造细节、代码生成阶段频繁出现UI错位及空文件、Debug时陷入修一坏一的死循环,且完全无法像Claude或Opus那样有效调用MCP工具链。作者对比后认为,Kimi k2.5的实际工程能力不仅不如传言中的超越Sonnet 4.6,甚至可能不如Sonnet 4.5,暴露出国产模型在追求极速的同时,仍缺乏深层的逻辑规划与工具调用能力。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册