sllm:推出 GPU 节点分租服务,以“无限 Token”模式降低大模型推理成本

近日,一款名为 sllm 的云端服务在 Hacker News 上引发了关注。该平台旨在解决高性能 GPU 获取门槛高的问题,允许开发者与其他人通过“拼单”方式共享一个 GPU 节点。用户只需支付固定的月费(10美元至40美元不等),即可获得对应算力配额,并享受“无限 Token”的推理服务,从而避免按 Token 计费带来的高昂成本波动。界面显示其支持包括 Llama-4-scout、Qwen-3.5、DeepSeek-v3.2 等超大参数模型。尽管目前页面显示资源已满,但这种将高端算力切片并低价共享的模式,为独立开发者和初创企业提供了一种绕过硬件壁垒、低成本运行前沿大模型的新路径。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册