在AI编程场景中,由于每一轮对话都需要重新发送完整的系统提示词、工具定义和历史记录,导致Token消耗巨大且成本高昂。虽然Anthropic提供了Prompt Caching(提示词缓存)API,能将缓存读取成本降至原来的十分之一,但要求开发者手动插入断点,操作繁琐且门槛较高。近日,一款名为Prompt-caching的MCP插件解决了这一痛点。它能自动识别系统提示词、工具定义等稳定片段并智能插入缓存断点。实测数据显示,在进行代码重构、Bug修复等任务时,该插件能节省80%至92%的Token费用,且兼容Cursor、Claude Code、Zed等主流IDE,显著提升了AI辅助开发的性价比。
原文链接:Hacker News

IT资源栈
评论前必须登录!
立即登录 注册