近期社区讨论指出,随着 DeepSeek、Kimi 等新一代模型参数量向万亿(1T)级别逼近,开源大模型的“满血”部署正变得难以为继。用户实测发现,即便拥有 8 张 L20 显卡,在量化后也难以承载这些巨量参数,导致部署成本极其高昂。这一趋势引发了业界的广泛担忧:如果中小参数规模的满血模型(如 Qwen 系列)停止更新,现有中端算力硬件将面临淘汰,AI 技术的“私有化自由”可能因算力壁垒而被迫终结。
原文链接:Linux.do
近期社区讨论指出,随着 DeepSeek、Kimi 等新一代模型参数量向万亿(1T)级别逼近,开源大模型的“满血”部署正变得难以为继。用户实测发现,即便拥有 8 张 L20 显卡,在量化后也难以承载这些巨量参数,导致部署成本极其高昂。这一趋势引发了业界的广泛担忧:如果中小参数规模的满血模型(如 Qwen 系列)停止更新,现有中端算力硬件将面临淘汰,AI 技术的“私有化自由”可能因算力壁垒而被迫终结。
原文链接:Linux.do
评论前必须登录!
立即登录 注册