智谱GLM-5.2实测实录:单Agent耗资1.2亿Token循环一小时,最终“颗粒无收”

近日,技术社区 Linux.do 的一则关于智谱 GLM-5.2 模型的使用反馈引发了关注。一名 Pro 级别用户在测试单 Agent 模式下的代码修复任务时,遭遇了典型的“资源空耗”现象。据用户描述,该 Agent 在约一小时的运行时间内,消耗了高达 1.2 亿单位的 Token(注:该数值暗示了极其高频的思考与交互次数)。尽管系统资源投入巨大,但该 Agent 最终未能解决任何实际问题。Agent 在尝试修复一个特定 Bug 的过程中陷入了死循环,长时间反复重试同一逻辑路径,最终因自动停止机制或超时而终止,结果被用户评价为“解决了 0 个问题”。这一案例直观地展示了当前 AI Agent 在处理复杂逻辑任务时的“幻觉陷阱”与规划能力短板,即在缺乏有效反馈循环和验证机制的情况下,即使是先进的大模型也可能在局部错误中空耗巨额算力。

事件分析

该事件深刻揭示了当前自主 AI Agent 架构在复杂工程任务中面临的“无限循环”与“成本失控”风险。1.2 亿 Token 的消耗量远超常规补全任务,暗示 Agent 进行了深度的自我思考或工具调用链,但未能跳出错误逻辑闭环。这表明仅依靠模型的推理能力不足以保证任务收敛,自我修正与终止判定机制是当前 Agent 工程缺失的关键拼图。对于开发者而言,在依赖 Agent 进行自动化开发时,必须引入严格的时间预算限制、状态检查点或人工干预层,以防止算力资源的无效燃烧。这也侧面反映了从“辅助编程”向“全自动 Agent”演进过程中,稳定性仍是最大瓶颈。

💡 核心观点:耗资1.2亿Token颗粒无收,暴露了当前单Agent架构在复杂任务中缺乏有效规划与验证机制的致命短板。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册