DeepSeek新长文本模型实测:百万级上下文窗口细节表现惊艳

DeepSeek 近日推出了支持 1M 上下文的新大模型,用户实测显示其在超长文本处理上表现优异。测试者上传了 30 个 Markdown 文件(预估 27 万 Tokens),涵盖自创的 GSCU 设定集,并提出了五个针对细节的刁钻问题。结果显示,DeepSeek 不仅能精准记住人物、物品及地点等具体细节,还能有效避免凭空编造内容,仅在高并发下偶发服务器繁忙。这一实测验证了 DeepSeek 在长文本领域的突破,标志着国产开源大模型在处理超长逻辑链方面已具备工业级实力。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册