AI 推理领域的“性能黑马” Cerebras 近期遭遇了成长的烦恼。由于用户量激增,官方宣布临时降低两款预览模型——zai-glm-4.7 和 qwen-3-235b-a22b-instruct-2507 的免费层调用频率限制,甚至导致部分监控渠道报警无法使用。Cerebras 凭借其独特的 WSE 芯片架构提供极致推理速度,一直是开发者眼中的首选。官方回应称正在全力恢复服务。此次事件虽引发社区对稳定性的担忧,但也侧面印证了市场对高性能、低成本 AI 推理服务的巨大渴求。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册