AI初创公司StepFun发布了最新大模型Step 3.5 Flash,主打“快到能思考,可靠到能行动”。该模型采用混合专家(MoE)架构,拥有1960亿总参数,但推理时每个Token仅激活110亿参数,显著提升了效率。性能方面,该模型在多项基准测试中表现优异,击败了月之暗面的Kimi K2.5及智谱GLM 4.7。此外,其4-bit量化版本允许在128GB内存的个人设备(如Mac Studio)上运行,兼顾了高性能与低门槛部署。
原文链接:Hacker News
AI初创公司StepFun发布了最新大模型Step 3.5 Flash,主打“快到能思考,可靠到能行动”。该模型采用混合专家(MoE)架构,拥有1960亿总参数,但推理时每个Token仅激活110亿参数,显著提升了效率。性能方面,该模型在多项基准测试中表现优异,击败了月之暗面的Kimi K2.5及智谱GLM 4.7。此外,其4-bit量化版本允许在128GB内存的个人设备(如Mac Studio)上运行,兼顾了高性能与低门槛部署。
原文链接:Hacker News
评论前必须登录!
立即登录 注册