Trinity 团队发布 4000 亿参数稀疏 MoE 模型 Trinity Large,采用 4-of-256 架构,仅激活 13B 参数,推理速度提升 2-3 倍。该模型提供 Base、Preview 和 TrueBase 三个版本,其中 Preview 版在 MMLU 上超越 Llama 4 Maverick。即将推出的推理版在数学测试中表现惊艳。目前该模型已开源并在 OpenRouter 上线。
原文链接:Linux.do
Trinity 团队发布 4000 亿参数稀疏 MoE 模型 Trinity Large,采用 4-of-256 架构,仅激活 13B 参数,推理速度提升 2-3 倍。该模型提供 Base、Preview 和 TrueBase 三个版本,其中 Preview 版在 MMLU 上超越 Llama 4 Maverick。即将推出的推理版在数学测试中表现惊艳。目前该模型已开源并在 OpenRouter 上线。
原文链接:Linux.do
评论前必须登录!
立即登录 注册