针对MinerU解析PPT时存在的图片文字残留和换行算法不理想等痛点,开发者推出了V2.0版本。新版本彻底重构底层逻辑,核心引入PaddleOCR技术,大幅提升了文字识别精度和切割合理性。MinerU现在仅负责图片切割和版面分析,功能更加精简高效。该项目已开源,旨在解决NotebookLM等生成PPT无法二次编辑的问题。
原文链接:Linux.do
针对MinerU解析PPT时存在的图片文字残留和换行算法不理想等痛点,开发者推出了V2.0版本。新版本彻底重构底层逻辑,核心引入PaddleOCR技术,大幅提升了文字识别精度和切割合理性。MinerU现在仅负责图片切割和版面分析,功能更加精简高效。该项目已开源,旨在解决NotebookLM等生成PPT无法二次编辑的问题。
原文链接:Linux.do
评论前必须登录!
立即登录 注册