随着DeepSeek模型的热度攀升,许多用户尝试在沉浸式翻译等插件中接入其API。然而,DeepSeek V4 Flash 默认启用了“思考模式”,虽然能提升回答准确性,但在翻译场景下不仅增加延迟,还会导致Token消耗量激增,徒增API调用成本。本文探讨了在沉浸式翻译插件中调用API时,如何通过参数设置显式关闭DeepSeek-V4-Flash的Thinking功能。这对于希望利用DeepSeek强大翻译能力但又不希望为冗长的思维过程付费的用户来说,是一份极具实用价值的指南。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册