近期有开发者在实际使用中发现,在处理完全相同的上下文内容时,Claude模型显示消耗的Token数量显著高于GPT和GLM等竞品,差异幅度高达1.5倍。例如,在GPT显示消耗18万Token的场景下,切换至Claude后数值飙升至26万。这一现象不仅直接导致API调用成本成倍增加,也使得用户更频繁地触及上下文窗口上限,被迫进行对话压缩。该问题引发了社区对大模型分词器效率及隐性使用成本的广泛关注。
原文链接:Linux.do
近期有开发者在实际使用中发现,在处理完全相同的上下文内容时,Claude模型显示消耗的Token数量显著高于GPT和GLM等竞品,差异幅度高达1.5倍。例如,在GPT显示消耗18万Token的场景下,切换至Claude后数值飙升至26万。这一现象不仅直接导致API调用成本成倍增加,也使得用户更频繁地触及上下文窗口上限,被迫进行对话压缩。该问题引发了社区对大模型分词器效率及隐性使用成本的广泛关注。
原文链接:Linux.do
评论前必须登录!
立即登录 注册