近期,大量用户反馈谷歌Gemini Ultra(Gemini Advanced)的使用额度再次下调,高峰期每日对话次数限制在130次左右,非高峰期约为180次。这一连续的限流动作引发了社区对谷歌算力储备的广泛猜测。分析认为,这可能源于谷歌H100等高端GPU的产能瓶颈、巨大的推理成本压力,或是为了保障其核心搜索业务(SGE)的算力需求,被迫压缩个人用户的资源配额。
原文链接:Linux.do
近期,大量用户反馈谷歌Gemini Ultra(Gemini Advanced)的使用额度再次下调,高峰期每日对话次数限制在130次左右,非高峰期约为180次。这一连续的限流动作引发了社区对谷歌算力储备的广泛猜测。分析认为,这可能源于谷歌H100等高端GPU的产能瓶颈、巨大的推理成本压力,或是为了保障其核心搜索业务(SGE)的算力需求,被迫压缩个人用户的资源配额。
原文链接:Linux.do
评论前必须登录!
立即登录 注册