该项目针对 DuckDB 的向量相似度搜索(VSS)扩展进行了关键优化。原版 HNSW 索引在处理带过滤条件的查询(如 WHERE category=’X’)时,会先检索再过滤,导致在数据稀疏时无法返回足够数量的结果(即 LIMIT 10 可能只返回 0 条)。该扩展通过引入 ACORN-1 算法,将过滤谓词推入图遍历过程,利用“两跳扩展”策略恢复连通性,确保在高选择性过滤下仍能保持高召回率。这不仅修复了查询结果不足的问题,还通过策略切换(精确扫描 vs ACORN-1 vs 后过滤)优化了性能。
原文链接:Hacker News

IT资源栈
评论前必须登录!
立即登录 注册