一位开发者分享其通过 OneClaw 平台部署 10 个 AI Agent 的经历,由于在所有场景下均使用高价的 Claude Opus 模型,2 月份的 Token 费用高达 5000 美元。为解决成本问题,该开发者开发了一款 LLM 智能路由 ClawRouters。该工具能在毫秒级内对任务进行分类,将简单问答等低难度请求分流至 Gemini Flash 或 GPT-4o-mini 等低成本模型,仅在复杂推理时调用 Opus。实测显示,该方案将月账单从 5000 美元降至 800 美元以下,且输出质量无明显下降。该方案完全兼容 OpenAI API,支持自带密钥且不收取中间商差价。
原文链接:V2EX 分享发现

IT资源栈
评论前必须登录!
立即登录 注册