据社区用户观察,DeepSeek 近期似乎对 Web 端模型进行了低调但重要的更新。对比测试发现,针对此前需要思考 200 秒却仍答错的复杂逻辑题(俗称“糖果题”),新模型现在能够通过长达 800 秒的深度思考链得出正确答案。这一变化不仅展示了模型在推理耐心和逻辑深度上的显著提升,也暗示 DeepSeek 正在积极探索如何通过延长推理时间来换取更高的任务准确性,这标志着国产大模型在逻辑推理领域的持续突破。
原文链接:Linux.do
据社区用户观察,DeepSeek 近期似乎对 Web 端模型进行了低调但重要的更新。对比测试发现,针对此前需要思考 200 秒却仍答错的复杂逻辑题(俗称“糖果题”),新模型现在能够通过长达 800 秒的深度思考链得出正确答案。这一变化不仅展示了模型在推理耐心和逻辑深度上的显著提升,也暗示 DeepSeek 正在积极探索如何通过延长推理时间来换取更高的任务准确性,这标志着国产大模型在逻辑推理领域的持续突破。
原文链接:Linux.do
评论前必须登录!
立即登录 注册