AI 初创公司 PrismML 宣布推出首批“商业可行”的 1-bit 权重大语言模型——1-Bit Bonsai 系列。该模型基于加州理工学院的突破性研究,通过极致的量化技术,在不牺牲精度的前提下实现了极高的智能密度。数据显示,其 8B 参数模型仅需 1.15GB 内存,比全精度模型体积小 14 倍,推理速度快 8 倍,能耗低 5 倍。该技术直击大模型在手机和机器人端落地的内存与功耗瓶颈,有望让实时高性能 AI Agent 真正普及化。
原文链接:Hacker News
AI 初创公司 PrismML 宣布推出首批“商业可行”的 1-bit 权重大语言模型——1-Bit Bonsai 系列。该模型基于加州理工学院的突破性研究,通过极致的量化技术,在不牺牲精度的前提下实现了极高的智能密度。数据显示,其 8B 参数模型仅需 1.15GB 内存,比全精度模型体积小 14 倍,推理速度快 8 倍,能耗低 5 倍。该技术直击大模型在手机和机器人端落地的内存与功耗瓶颈,有望让实时高性能 AI Agent 真正普及化。
原文链接:Hacker News
评论前必须登录!
立即登录 注册