Google 调整 Gemini Pro 限额机制:转向算力计量,简单调用 Google Maps 即消耗 3% 周配额

据科技社区 Linux.do 用户反馈,Google 已悄然调整 Gemini Pro 服务的用量限额机制,从原本的请求次数限制转变为严格基于算力消耗的计量模式。这一调整导致用户在实际使用中发现配额消耗速度显著加快。一名用户在实测中报告,仅向 Gemini 1.5 Pro 提问两个关于麻城与黄冈地理位置的简单问题,即消耗了高达 3% 的周额度。具体记录显示,第一个问题触发了 Google Maps 的工具调用(Tool Calling),模型进行了联网检索并生成路线规划;第二个问题则是基础的行政级别文本介绍。尽管最终输出内容仅数百字,但由于涉及模型内部推理、工具调度及多模态处理,后台算力消耗巨大。这一变更引发了开发者群体的广泛讨论,部分用户戏称其为“美国豆包”,以此调侃其配额消耗速度之快。

事件分析

Google 此次将限额机制转向算力计量,反映了大模型服务商在商业化进程中的必然趋势,即从粗放的“按次计费”向精细化的“按负载计费”转型。随着 AI Agent 技术的普及,单一请求往往伴随着复杂的内部思维链和外部 API 调用,这些“隐性算力”成本往往数倍于简单的文本生成。新机制真实映射了底层 GPU 和推理引擎的负载,警示开发者在构建应用时不能仅关注输出 Token 量,更需严格控制 Prompt 复杂度与工具调用的频次,否则将在无意识中耗尽预算。

💡 核心观点:限额机制转算力计量揭示了 AI Agent 落地的隐性成本,工具调用与推理链路将显著推高资源消耗,迫使开发架构向高效率演进。

原文链接:Linux.do

相关阅读

  • 暂无文章

抢沙发

评论前必须登录!

立即登录   注册