近日,多名开发者在技术社区反馈,智谱 GLM 系列模型在日常调用中出现严重的 429 限流报错,导致基于 NewAPI 的服务几乎无法正常运行。尽管国内算力资源看似充足,但针对性的限流策略引发了用户对厂商资源分配的质疑。对比测试显示,切换至 MiniMax 等竞争对手模型后,服务恢复了平稳。这一事件不仅暴露了头部大模型在商业落地与资源调度上的矛盾,也警示行业:在价格战之后,API 的服务稳定性已成为留住开发者、构建生态的关键护城河。
原文链接:Linux.do
近日,多名开发者在技术社区反馈,智谱 GLM 系列模型在日常调用中出现严重的 429 限流报错,导致基于 NewAPI 的服务几乎无法正常运行。尽管国内算力资源看似充足,但针对性的限流策略引发了用户对厂商资源分配的质疑。对比测试显示,切换至 MiniMax 等竞争对手模型后,服务恢复了平稳。这一事件不仅暴露了头部大模型在商业落地与资源调度上的矛盾,也警示行业:在价格战之后,API 的服务稳定性已成为留住开发者、构建生态的关键护城河。
原文链接:Linux.do
评论前必须登录!
立即登录 注册