第三方Claude接口为何极度省Token?或因将思考过程“黑盒化”

近日,有用户在测试基于Claude的第三方接口时发现,其Token消耗量远低于官方订阅,推测这是因为服务商将模型的深度推理过程进行了“内部化”处理,未将中间思考步骤计入用户输出。虽然这种机制导致响应时间延长至3分钟且缺乏缓存机制,但它揭示了低成本AI服务的一种优化路径:通过隐藏思维链以牺牲响应速度和透明度为代价,换取显著的成本优势。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册