IT资源栈-IT资源与技术分享IT资源栈-IT资源与技术分享IT资源栈
  • 首页
  • AI
  • 前沿
  • 专题
  • 碎片
  • 架构
  • 实战
  • 安全
  • 生活
  • 工具
  • 管理
  • 监控
  • 读者墙
  • 标签云
  • 文章存档
  • 友情链接
Hi, 请登录     我要注册     找回密码

阶跃星辰发布Step 3.5 Flash:适配昇腾英伟达,推理速度每秒350 token

分类:前沿 阅读(1) 评论(0)

阶跃星辰正式发布新一代开源Agent基座模型Step 3.5 Flash。该模型采用稀疏MoE架构,总参数960亿,每个Token仅激活约110亿参数,兼顾性能与效率。其推理速度高达每秒350个Token,专为实时Agent工作流设计。目前,华为昇腾、沐曦、壁仞、燧原、天数智芯及阿里平头哥等多家芯片厂商已完成适配,同时也登陆了NVIDIA NIM平台。

原文链接:Linux.do

AI Agent大模型开源推理加速芯片适配

相关阅读

  • AI Agent 的身份:不是模型,而是「尝试」本身
  • 开源平台 Distr 2.0 发布:打通 AI Agent 与软件分发的“最后一公里”
  • 赛博斗蛐蛐:DeepSeek在“谁是卧底”中投票给自己,AI群聊项目引热议
  • 换个模型,我还是我吗?
  • 开源协作的惊喜:4.4k 星项目 Deep Research 获大量更新,2.0 重构版即将重启
  • 拒绝AI“过度顺从”:巧用“第三方视角”获取更客观的评价
  • 告别枯燥问卷:这款 AI 工具通过互动剧情实时分析你的人格
  • 打造 AI 剧场:开源项目 WebMultiAgentChat 实现多智能体自动群聊
  • CrewAI实战遭百级并发“滑铁卢”,开发者急寻高可用Agent替代方案
  • 开发者推出自动化工具,免费为 GitHub 项目生成生产级 Dockerfile

抢沙发

评论前必须登录!

立即登录   注册

© 2026   IT资源栈