近日,有用户在社区分享了对Kimi疑似新版模型k2.6的测试报告。测试发现,该模型在代码任务中未能准确理解复述需求而直接修改代码,且在系统查询中给出冗杂的资源占用信息。尤为引人注目的是,其思考链过长,直接暴露了代码修改动作和源文件内容,这与ChatGPT、Claude隐藏具体修改动作的习惯截然不同,增加了用户的等待成本,引发了对模型优化方向的讨论。
原文链接:Linux.do
近日,有用户在社区分享了对Kimi疑似新版模型k2.6的测试报告。测试发现,该模型在代码任务中未能准确理解复述需求而直接修改代码,且在系统查询中给出冗杂的资源占用信息。尤为引人注目的是,其思考链过长,直接暴露了代码修改动作和源文件内容,这与ChatGPT、Claude隐藏具体修改动作的习惯截然不同,增加了用户的等待成本,引发了对模型优化方向的讨论。
原文链接:Linux.do
评论前必须登录!
立即登录 注册