OpenRouter 免费开放国产新模型:阶跃星辰 Step 3.5 Flash,峰值飙至 350 tok/s

国产大模型厂商阶跃星辰(StepFun)发布了新模型 Step 3.5 Flash,并登陆 OpenRouter 平台开启限时免费调用。该模型采用 MoE 架构,总参数 196B 但激活参数仅 11B,支持 256K 超长上下文。其最大亮点在于极致的推理速度,峰值可达 350 tok/s,且量化后(int4)对硬件要求亲民,仅需 128GB 显存即可在本地流畅运行,被视为目前性价比极高的“速度之王”。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册