本文通过对Google Gemini API的连续测试,详细记录了Gemini 2.5 Flash和Gemini 3 Pro (Low)两个模型的配额消耗情况。测试显示,两个模型在第17次对话后同时达到配额限制,且重置时间完全相同。作者据此猜测,Gemini 3 Pro的High和Low版本可能没有实际区别,所有请求可能都定向到同一个Low级别的服务上。文章还分析了配额消耗的规律,指出官方宣传的’宽松限速’实际上存在时间窗口内的使用限制,频繁出错时重试机制也令人困惑。这一分析为开发者和研究人员理解Google Gemini模型的配额限制和使用策略提供了有价值的参考,也为评估AI模型服务提供商的透明度提供了案例。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册