据用户反馈,字节跳动旗下豆包AI近期在流量高峰期对“专家模型”实施了限流措施。当服务器负载过高时,系统会自动将用户请求路由至响应更快但性能稍弱的“普通”模型。这一举措折射出随着大模型能力跨入生产力门槛,高昂的推理成本已难以支撑类似Gemini Flash早期的“无限免费”模式。业界分析认为,这标志着AI行业正从粗放式烧钱转向精细化运营,未来针对高阶模型的使用门槛或将进一步提高。
原文链接:Linux.do
据用户反馈,字节跳动旗下豆包AI近期在流量高峰期对“专家模型”实施了限流措施。当服务器负载过高时,系统会自动将用户请求路由至响应更快但性能稍弱的“普通”模型。这一举措折射出随着大模型能力跨入生产力门槛,高昂的推理成本已难以支撑类似Gemini Flash早期的“无限免费”模式。业界分析认为,这标志着AI行业正从粗放式烧钱转向精细化运营,未来针对高阶模型的使用门槛或将进一步提高。
原文链接:Linux.do
评论前必须登录!
立即登录 注册