针对当前 AI 在处理复杂 PDF、Excel 等文档时易产生“幻觉”的痛点,开发者开源了其历时七年打造的文档解析引擎 Knowhere。该工具通过将复杂格式转化为结构化 JSON 数据并构建知识树记忆,大幅提升了 AI 读取长文档的准确率。实测表明,Knowhere 能降低 50% 以上的 Token 消耗,解析效率提升 3 倍,且在本地部署依赖和 GPU 需求上优于 Unstructured 和 MinerU 等竞品,有效解决了 RAG 应用中“垃圾进、垃圾出”的难题。
原文链接:V2EX 分享发现

IT资源栈
评论前必须登录!
立即登录 注册