600M参数小模型逆袭:KeyATTEN在关键词提取上碾压Gemini,速度快500倍

开发者推出了基于Qwen3-embedding 0.6B参数的开源关键词提取模型KeyATTEN。通过引入QKLORA新思路,该模型在中文新闻数据集的抽取式关键词提取任务中表现优异:相比Gemini 3 flash-lite,其F1@10性能高出14%,召回率提升30%,且本地推理速度快约500倍。该项目展示了零样本学习的潜力,无需API费用,非常适合文章索引与打标签场景。目前该模型在长文本处理及提炼式关键词生成上仍有局限,但证明了轻量级模型在特定NLP任务上的巨大潜力。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册