近日,在 V2EX 和 Reddit 的 Google Antigravity 社区中,关于 Antigravity 3.5 Flash 版本的热度急剧上升。作为 Google 实验性的 AI 智能体项目,Antigravity 通常被视为 Gemini 技术栈的延伸或特定场景下的高阶版本,主要用于代码生成与复杂逻辑推理。然而,多位资深开发者在实际测试中发现,相较于旧版 3.1 Flash,新版本的额度消耗呈现出非线性的激增趋势,高达 6 倍之多。尽管此次更新可能意在增强模型的思维链(CoT)推演能力和代码准确性,但随之而来的是极其昂贵的 Token 消耗。Reddit 社区充斥着对这一问题的抱怨,许多用户表示在日常的 AI 编程和脚本调试中,配额在极短时间内即告罄,严重影响了开发体验。这一现象不仅暴露了 Google 在新一代模型资源计费策略上的激进,也侧面印证了“推理增强”类模型对算力的庞大需求,引发了开发者对工具性价比的广泛担忧。
事件分析
从技术视角来看,Antigravity 3.5 Flash 额度消耗的激增,极大概率源于模型底层推理机制的迭代。如果该版本引入了更长的思维链或类似的“慢思考”模式,模型在生成最终结果前会产生大量不可见或半可见的推理 Token,这直接导致了 API 调用成本的指数级上升。这种架构变化虽然能显著提升复杂逻辑任务的表现,但在未显著降低单价的情况下,给开发者的使用成本带来了巨大压力。这也反映了当前 AI 行业从“预测下一个词”向“强化推理”演进过程中的普遍痛点。对于 Google 而言,如何在维持高性能模型竞争力的同时,解决开发者对成本的敏感度,将成为 Antigravity 及其相关生态能否留住核心用户的关键。若消耗问题持续存在且无优化方案,可能导致开发者流向 DeepSeek、Claude 等竞品或开源模型。
💡 核心观点:暴增的算力成本揭示了推理模型的落地痛点,若 Google 无法平衡“智力”与“效能”,昂贵的 Antigravity 恐将沦为开发者的尝鲜玩具。
原文链接:V2EX 分享发现

IT资源栈
评论前必须登录!
立即登录 注册