Cohere 发布最强开源语音大模型 Transcribe:准确率超越 Whisper,登顶 HuggingFace 榜单

AI 企业 Cohere 正式宣布推出全新的自动语音识别(ASR)模型 Cohere Transcribe。该模型拥有 20 亿参数,基于 Conformer 架构构建,从零开始训练并支持包括中文在内的 14 种语言。在权威的 HuggingFace 开源 ASR 排行榜中,Transcribe 以 5.42% 的平均词错误率(WER)夺得榜首,其表现显著优于 OpenAI 的 Whisper Large v3、ElevenLabs Scribe v2 等现有竞品。除了精度提升,该模型还特别注重生产环境下的推理吞吐量和低延迟,已通过 Apache 2.0 协议开源 weights,并集成至 Cohere 的企业级平台中,旨在为未来的 AI Agent 和自动化工作流提供核心语音处理能力。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册