英伟达宣布NIM APIs免费提供最新大模型glm-4.7和minimax-m2.1,虽未在官方页面列出,但实测可用。由于资源紧张,处理速度较慢,glm-4.7在聊天场景下为25tokens/s,minimax-m2.1为150tokens/s。开发者可通过指定API URL使用这些模型。文章建议国内大模型平台免费额度充足,可作为替代选择,强调国内厂商如阿里、字节引擎等在免费API领域的竞争力。
原文链接:Linux.do
英伟达宣布NIM APIs免费提供最新大模型glm-4.7和minimax-m2.1,虽未在官方页面列出,但实测可用。由于资源紧张,处理速度较慢,glm-4.7在聊天场景下为25tokens/s,minimax-m2.1为150tokens/s。开发者可通过指定API URL使用这些模型。文章建议国内大模型平台免费额度充足,可作为替代选择,强调国内厂商如阿里、字节引擎等在免费API领域的竞争力。
原文链接:Linux.do
评论前必须登录!
立即登录 注册