近日,有开发者在技术社区 V2EX 发帖吐槽 MiniMax 的 Token 服务遭遇严重稳定性问题。该用户在周末休息后的周一首次使用,便频繁遭遇“overloaded_error”(过载错误),系统提示当前服务集群负载较高。错误日志显示,请求在经历了长达数分钟的挂起和 9 次重试后依然超时,且触发了 Claude 的深度思考机制,消耗了大量 Token。这一事件暴露了在 AI 模型需求激增的背景下,第三方 API 服务商在负载均衡和服务器资源调度方面仍面临严峻挑战。
原文链接:V2EX 分享发现

IT资源栈
评论前必须登录!
立即登录 注册