开发者推出了基于Qwen3-embedding 0.6B参数的开源关键词提取模型KeyATTEN。通过引入QKLORA新思路,该模型在中文新闻数据集的抽取式关键词提取任务中表现优异:相比Gemini 3 flash-lite,其F1@10性能高出14%,召回率提升30%,且本地推理速度快约500倍。该项目展示了零样本学习的潜力,无需API费用,非常适合文章索引与打标签场景。目前该模型在长文本处理及提炼式关键词生成上仍有局限,但证明了轻量级模型在特定NLP任务上的巨大潜力。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册