通义千问团队正式发布全模态模型Qwen3.5 Omni,其核心亮点在于支持高达256k的超长上下文窗口,能够处理超过10小时的纯音频或400秒的音视频输入。该模型具备极强的多语言能力,支持113种语种和方言的语音识别。功能方面,Qwen Chat集成了聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索及工具调用等综合能力。值得注意的是,该模型目前暂无开源计划,仅支持通过API进行商业调用。
原文链接:Linux.do
通义千问团队正式发布全模态模型Qwen3.5 Omni,其核心亮点在于支持高达256k的超长上下文窗口,能够处理超过10小时的纯音频或400秒的音视频输入。该模型具备极强的多语言能力,支持113种语种和方言的语音识别。功能方面,Qwen Chat集成了聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索及工具调用等综合能力。值得注意的是,该模型目前暂无开源计划,仅支持通过API进行商业调用。
原文链接:Linux.do
评论前必须登录!
立即登录 注册