一位开发者在使用 Claude Max 进行整晚高强度编程后,惊讶地发现后台统计的 Token 数量仅有几百或几千,远低于切换到 GPT 处理同一项目时的几万 Token。这种显著的差异引发了社区对 Claude 缓存机制的热议。这一现象表明,Claude 可能采用了极为高效的提示词缓存技术,使得在长对话或重复上下文场景下,实际消耗的计算资源大幅降低。这不仅意味着开发者能以更低成本获得高并发体验,也揭示了不同大模型在底层架构与成本控制上的巨大技术分野。
原文链接:Linux.do
一位开发者在使用 Claude Max 进行整晚高强度编程后,惊讶地发现后台统计的 Token 数量仅有几百或几千,远低于切换到 GPT 处理同一项目时的几万 Token。这种显著的差异引发了社区对 Claude 缓存机制的热议。这一现象表明,Claude 可能采用了极为高效的提示词缓存技术,使得在长对话或重复上下文场景下,实际消耗的计算资源大幅降低。这不仅意味着开发者能以更低成本获得高并发体验,也揭示了不同大模型在底层架构与成本控制上的巨大技术分野。
原文链接:Linux.do
评论前必须登录!
立即登录 注册