Qwen 3.5 推出新模型:疑用Claude 4.6 Opus数据蒸馏,推理能力对标顶尖水平

社区近日出现了一款名为Qwen3.5-27B-Claude-4.6-Opus的蒸馏模型,引起了技术爱好者的关注。据介绍,该模型使用了约14000个Claude 4.6 Opus风格的通用推理样本进行训练。这是一种模型蒸馏技术的应用,旨在通过高性能模型的输出数据来训练较小的开源模型,使其获得接近顶尖闭源模型的推理能力。该模型以GGUF格式发布,方便用户在本地部署测试,展现了开源社区利用合成数据追赶SOTA(当前最佳)模型的最新尝试。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册