一项针对DeepSeek API的极限测试显示,该模型在处理超长文本时表现出色。测试者使用了一段约40万字的未公开数据集,输入Token量高达18万。在开启Reasoner(推理)模式后,模型经过400多秒的深度思考,成功从海量无关信息中精准提取了目标细节(大海捞针测试)。这不仅验证了DeepSeek在长上下文窗口中的稳定性,也展示了其推理模式在复杂信息检索任务中的强大潜力。
原文链接:Linux.do
一项针对DeepSeek API的极限测试显示,该模型在处理超长文本时表现出色。测试者使用了一段约40万字的未公开数据集,输入Token量高达18万。在开启Reasoner(推理)模式后,模型经过400多秒的深度思考,成功从海量无关信息中精准提取了目标细节(大海捞针测试)。这不仅验证了DeepSeek在长上下文窗口中的稳定性,也展示了其推理模式在复杂信息检索任务中的强大潜力。
原文链接:Linux.do
评论前必须登录!
立即登录 注册