阿里Ovis2.6重磅开源:OCR能力力压GPT-4o,引入DeepSeek式思维链

阿里国际 AI 团队(AIDC-AI)正式开源 Ovis2.6 系列多模态大模型。该版本在视觉文字处理上实现突破,其 7B 版本在 CVTG-2K 文字生成榜单上以 0.9200 的准确率超越 GPT-4o,并在中文长文本 OCR 场景中表现领先。Ovis2.6 引入类似 DeepSeek 的“思维链”推理机制,通过可解释的思考步骤提升复杂逻辑分析能力。该系列模型提供 2B 至 9B 等多种规格,支持消费级显卡部署,并已适配 vLLM 与 ComfyUI。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册