PrismML 发布首批商用 1-bit LLM Bonsai:内存骤降 14 倍,重塑端侧 AI 效率

AI 初创公司 PrismML 宣布推出首批“商业可行”的 1-bit 权重大语言模型——1-Bit Bonsai 系列。该模型基于加州理工学院的突破性研究,通过极致的量化技术,在不牺牲精度的前提下实现了极高的智能密度。数据显示,其 8B 参数模型仅需 1.15GB 内存,比全精度模型体积小 14 倍,推理速度快 8 倍,能耗低 5 倍。该技术直击大模型在手机和机器人端落地的内存与功耗瓶颈,有望让实时高性能 AI Agent 真正普及化。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册