一位开发者成功克服了PlayStation 2仅32MB内存的硬件限制,在真机上运行了自研的10M参数语言模型。其核心创新在于“流式加载”:在推理过程中从CD-ROM逐矩阵读取权重,仅在内存中保留激活值和KV缓存,从而突破物理内存瓶颈。为此,开发者构建了自定义量化格式PSNT,解决了字节序问题并重写了大部分SDK。这一项目展示了在极度受限的复古硬件上运行现代AI算法的潜力。
原文链接:Hacker News
一位开发者成功克服了PlayStation 2仅32MB内存的硬件限制,在真机上运行了自研的10M参数语言模型。其核心创新在于“流式加载”:在推理过程中从CD-ROM逐矩阵读取权重,仅在内存中保留激活值和KV缓存,从而突破物理内存瓶颈。为此,开发者构建了自定义量化格式PSNT,解决了字节序问题并重写了大部分SDK。这一项目展示了在极度受限的复古硬件上运行现代AI算法的潜力。
原文链接:Hacker News
评论前必须登录!
立即登录 注册