开发者吐槽京东云:国产LLM推理慢到崩溃,基础设施稳定性堪忧

一位开发者在社区发帖吐槽京东云每月200元的AI编程服务(Coding Plan),指出其响应速度极慢,甚至出现模型“准备”阶段耗时5分钟以上的情况。该用户对比此前使用的火山引擎,发现京东云体验并未好转,且在使用Kimi k2.5和GLM-5等模型时频现卡顿与停止。这一反馈折射出当前国产云厂商在大模型落地过程中的普遍痛点:尽管应用层竞争激烈,但底层推理基础设施的稳定性和响应速度仍存在明显短板,严重制约了开发者的生产力。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册