开发者基于Rust重写了后端架构,推出了Galaxy PAI AI模型聚合服务平台。该服务在1核1G的廉价配置下实现了1000+并行请求的稳定处理,有效解决了429报错和长文本截断问题。平台目前已接入OpenAI免费模型及Nvidia NIM开源模型,提供OpenAI兼容接口。项目旨在测试架构性能极限,当前正公开测试并即将开源,适合需要高并发和低成本API调用的用户。
原文链接:Linux.do
开发者基于Rust重写了后端架构,推出了Galaxy PAI AI模型聚合服务平台。该服务在1核1G的廉价配置下实现了1000+并行请求的稳定处理,有效解决了429报错和长文本截断问题。平台目前已接入OpenAI免费模型及Nvidia NIM开源模型,提供OpenAI兼容接口。项目旨在测试架构性能极限,当前正公开测试并即将开源,适合需要高并发和低成本API调用的用户。
原文链接:Linux.do
评论前必须登录!
立即登录 注册