近期关于 Claude Opus 4.6 “智商降低”的争议引发了社区广泛关注。据 BridgeBench 幻觉基准测试显示,该模型今日的表现明显优于此前版本,Anthropic 似乎已针对推理能力进行了回调修复。此前用户曾指责厂商为节约成本而人为削弱模型性能,此次恢复性能或是对舆论的回应。此外,有消息称 Anthropic 计划于本周四发布全新的 Opus 4.7 版本,业界期待新版本能在保持高性能的同时避免性能波动。
原文链接:Linux.do
近期关于 Claude Opus 4.6 “智商降低”的争议引发了社区广泛关注。据 BridgeBench 幻觉基准测试显示,该模型今日的表现明显优于此前版本,Anthropic 似乎已针对推理能力进行了回调修复。此前用户曾指责厂商为节约成本而人为削弱模型性能,此次恢复性能或是对舆论的回应。此外,有消息称 Anthropic 计划于本周四发布全新的 Opus 4.7 版本,业界期待新版本能在保持高性能的同时避免性能波动。
原文链接:Linux.do
评论前必须登录!
立即登录 注册