AI 推理效率新突破:Mamba-3 模型发布,专为 Agent 时代设计

卡内基梅隆大学与 Together AI 等机构联合发布了 Mamba-3,这是一种专为“推理效率”优化的新型状态空间模型(SSM)。与侧重训练速度的前代不同,Mamba-3 通过引入更丰富的递归机制、复数值状态跟踪及 MIMO 变体,有效解决了线性架构在解码时的内存瓶颈。实测显示,在 1.5B 参数规模下,其综合延迟超越了 Llama-3.2-1B 等主流 Transformer 模型。团队已开源高性能内核,旨在应对 Agent 工作流爆发带来的巨大推理需求。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册