仅26M参数!Needle模型将Gemini工具调用能力蒸馏至极致,支持本地PC微调

Cactus Compute团队推出了名为Needle的超微型语言模型,参数量仅为2600万(26M)。该模型通过知识蒸馏技术从Gemini 3.1中提取核心能力,专注于高效的“工具调用”场景。尽管体积极小,Needle在单次函数调用任务中的表现超越了FunctionGemma-270m和Qwen-0.6B等规模更大的模型。其架构为“简单注意力网络”(SAN),推理速度极快(预填充6000 toks/s),且专为手机、手表等消费级设备设计。目前该项目已完全开源模型权重与数据集生成流程,用户甚至可以在普通的Mac或PC上通过Web UI对模型进行本地微调。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册