近日有开发者在社区反馈,DeepSeek模型在处理一项复杂的字符串解码任务时出现异常,思考时间超过2分钟仍无任何输出,且Web端与API端均存在该问题。在同等测试条件下,GPT与豆包虽未给出正确答案,但能快速响应并给出结果,仅有Gemini成功解出正确答案。这一案例引发了业界对于国产大模型在复杂逻辑推理稳定性及“长思考”模式下容错机制的讨论。
原文链接:Linux.do
近日有开发者在社区反馈,DeepSeek模型在处理一项复杂的字符串解码任务时出现异常,思考时间超过2分钟仍无任何输出,且Web端与API端均存在该问题。在同等测试条件下,GPT与豆包虽未给出正确答案,但能快速响应并给出结果,仅有Gemini成功解出正确答案。这一案例引发了业界对于国产大模型在复杂逻辑推理稳定性及“长思考”模式下容错机制的讨论。
原文链接:Linux.do
评论前必须登录!
立即登录 注册