社区用户通过上传约3MB的测试数据,对DeepSeek APP端模型进行了极限测试。测试结果显示,该模型疑似已支持100万token的超长上下文窗口,并成功通过了严苛的“大海捞针”测试,能够精准定位并提取隐藏在超长文本中的关键信息。这一发现若属实,意味着DeepSeek在长文本处理能力上已跻身全球顶尖水平,标志着国产大模型在超长上下文记忆与推理领域取得了重大技术突破。
原文链接:Linux.do
社区用户通过上传约3MB的测试数据,对DeepSeek APP端模型进行了极限测试。测试结果显示,该模型疑似已支持100万token的超长上下文窗口,并成功通过了严苛的“大海捞针”测试,能够精准定位并提取隐藏在超长文本中的关键信息。这一发现若属实,意味着DeepSeek在长文本处理能力上已跻身全球顶尖水平,标志着国产大模型在超长上下文记忆与推理领域取得了重大技术突破。
原文链接:Linux.do
评论前必须登录!
立即登录 注册