一位资深用户在对比测试中指出,DeepSeek V4 在面对无标准答案、约束条件复杂且隐蔽的开放性问题时,依然无法达到 Claude Opus 4.5/4.6 的水平。用户举例称,Opus 一轮即可解决的难题,DeepSeek 经七轮纠错花费 1 美元仍未解决。该用户推测,这可能是混合专家模型无法像稠密模型那样全面激活所需专家,导致其在主动探索边缘条件和深度思考上存在先天不足,且其思考时长(约 20 秒)也远不及 Opus。
原文链接:Linux.do
一位资深用户在对比测试中指出,DeepSeek V4 在面对无标准答案、约束条件复杂且隐蔽的开放性问题时,依然无法达到 Claude Opus 4.5/4.6 的水平。用户举例称,Opus 一轮即可解决的难题,DeepSeek 经七轮纠错花费 1 美元仍未解决。该用户推测,这可能是混合专家模型无法像稠密模型那样全面激活所需专家,导致其在主动探索边缘条件和深度思考上存在先天不足,且其思考时长(约 20 秒)也远不及 Opus。
原文链接:Linux.do
评论前必须登录!
立即登录 注册