智谱开源GLM-OCR:0.9B参数登顶SOTA,成本仅需传统方案1/10

智谱AI正式发布并开源轻量级多模态文档解析模型GLM-OCR。该模型参数量仅为0.9B,凭借自研CogViT视觉编码器,在权威榜单OmniDocBench V1.5中以94.6分登顶,性能比肩Gemini-3-Pro,并在公式、表格识别等领域实现SOTA。GLM-OCR支持vLLM、SGLang及Ollama部署,能精准解决手写、印章及多语言混排难题。商业API定价仅为0.2元/百万Tokens,约为传统OCR方案的十分之一,极大降低了文档智能处理门槛。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册