Google 调整 Gemini Pro 限额机制：转向算力计量，简单调用 Google Maps 即消耗 3% 周配额-IT资源栈

据科技社区 Linux.do 用户反馈，Google 已悄然调整 Gemini Pro 服务的用量限额机制，从原本的请求次数限制转变为严格基于算力消耗的计量模式。这一调整导致用户在实际使用中发现配额消耗速度显著加快。一名用户在实测中报告，仅向 Gemini 1.5 Pro 提问两个关于麻城与黄冈地理位置的简单问题，即消耗了高达 3% 的周额度。具体记录显示，第一个问题触发了 Google Maps 的工具调用（Tool Calling），模型进行了联网检索并生成路线规划；第二个问题则是基础的行政级别文本介绍。尽管最终输出内容仅数百字，但由于涉及模型内部推理、工具调度及多模态处理，后台算力消耗巨大。这一变更引发了开发者群体的广泛讨论，部分用户戏称其为“美国豆包”，以此调侃其配额消耗速度之快。

事件分析

Google 此次将限额机制转向算力计量，反映了大模型服务商在商业化进程中的必然趋势，即从粗放的“按次计费”向精细化的“按负载计费”转型。随着 AI Agent 技术的普及，单一请求往往伴随着复杂的内部思维链和外部 API 调用，这些“隐性算力”成本往往数倍于简单的文本生成。新机制真实映射了底层 GPU 和推理引擎的负载，警示开发者在构建应用时不能仅关注输出 Token 量，更需严格控制 Prompt 复杂度与工具调用的频次，否则将在无意识中耗尽预算。

💡 核心观点：限额机制转算力计量揭示了 AI Agent 落地的隐性成本，工具调用与推理链路将显著推高资源消耗，迫使开发架构向高效率演进。

原文链接：Linux.do

Google 调整 Gemini Pro 限额机制：转向算力计量，简单调用 Google Maps 即消耗 3% 周配额

事件分析

相关阅读

抢沙发

评论前必须登录！