一位开发者在测试中发现,启用MCP(模型上下文协议)及大量Skills后,仅一句简单的“你好”初始对话就消耗了近5万个Token。经分析,消耗“大头”主要来自固定的系统提示词、上百个技能描述、30多个工具的JSON Schema定义以及复杂的系统指令。这种高昂的“固定成本”严重挤占了模型(如Kimi)的上下文窗口,引发了社区关于AI Agent架构中如何按需开关工具、平衡功能与效率的深度讨论。
原文链接:Linux.do
一位开发者在测试中发现,启用MCP(模型上下文协议)及大量Skills后,仅一句简单的“你好”初始对话就消耗了近5万个Token。经分析,消耗“大头”主要来自固定的系统提示词、上百个技能描述、30多个工具的JSON Schema定义以及复杂的系统指令。这种高昂的“固定成本”严重挤占了模型(如Kimi)的上下文窗口,引发了社区关于AI Agent架构中如何按需开关工具、平衡功能与效率的深度讨论。
原文链接:Linux.do
评论前必须登录!
立即登录 注册