智谱AI正式发布并开源轻量级多模态文档解析模型GLM-OCR。该模型参数量仅为0.9B,凭借自研CogViT视觉编码器,在权威榜单OmniDocBench V1.5中以94.6分登顶,性能比肩Gemini-3-Pro,并在公式、表格识别等领域实现SOTA。GLM-OCR支持vLLM、SGLang及Ollama部署,能精准解决手写、印章及多语言混排难题。商业API定价仅为0.2元/百万Tokens,约为传统OCR方案的十分之一,极大降低了文档智能处理门槛。
原文链接:Linux.do
智谱AI正式发布并开源轻量级多模态文档解析模型GLM-OCR。该模型参数量仅为0.9B,凭借自研CogViT视觉编码器,在权威榜单OmniDocBench V1.5中以94.6分登顶,性能比肩Gemini-3-Pro,并在公式、表格识别等领域实现SOTA。GLM-OCR支持vLLM、SGLang及Ollama部署,能精准解决手写、印章及多语言混排难题。商业API定价仅为0.2元/百万Tokens,约为传统OCR方案的十分之一,极大降低了文档智能处理门槛。
原文链接:Linux.do
评论前必须登录!
立即登录 注册