NVIDIA推出Nemotron 3系列:高效开放AI新标准

NVIDIA正式发布Nemotron 3系列模型,这是目前最高效的开源模型家族,专为代理AI应用设计。该系列包含Nano、Super和Ultra三个模型,分别在成本效率、协作代理和高精度推理方面表现优异。Nemotron 3采用创新技术,包括混合Mamba-Transformer MoE架构、潜在专家设计、多令牌预测等,支持长达100万token的上下文长度。Nano模型在保持高准确度的同时,推理效率达到同类模型的3.3倍。NVIDIA已开源Nano模型的权重、训练配方及相关数据,为AI社区提供重要资源。这一发布标志着NVIDIA在高效AI模型领域的重要突破,将对AI应用开发和部署产生深远影响。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册