挑战 SOTA 的轻量级模型:GLM-OCR 发布,0.9B 参数实现端侧高性能文档解析

智谱AI旗下的轻量级OCR模型GLM-OCR正式发布。该模型参数量仅为0.9B,延续了当前AI模型向端侧和轻量化发展的趋势。官方数据显示,尽管体积小,但其在公式识别、表格还原和信息提取方面均达到SOTA(当前最佳)水平。在性能测试中,GLM-OCR处理PDF的速度可达1.86页/秒,显著优于同类竞品。这一突破意味着在算力有限的普通服务器或端侧设备上,也能低成本运行高精度的文档结构化任务,非常适合处理复杂PDF、发票及论文等场景。目前模型权重已在Hugging Face开源,并提供API试用。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册