通义团队发布了新一代 LLM-Agent 强化学习平台 AgentJet (Beta)。该框架支持对 AgentScope、LangChain 等技术栈构建的智能体工作流进行微调。AgentJet 专注于 Triple-M 概念,即多轮对话、多智能体协作和多模型训练,能有效解决复杂任务优化问题。它利用全异步 RFT 和上下文合并技术显著加速训练,并提供高分辨率日志和快速调试功能。目前该项目已在狼人杀等复杂场景中取得实验成果,旨在帮助开发者以最小成本提升智能体性能。
原文链接:Linux.do
通义团队发布了新一代 LLM-Agent 强化学习平台 AgentJet (Beta)。该框架支持对 AgentScope、LangChain 等技术栈构建的智能体工作流进行微调。AgentJet 专注于 Triple-M 概念,即多轮对话、多智能体协作和多模型训练,能有效解决复杂任务优化问题。它利用全异步 RFT 和上下文合并技术显著加速训练,并提供高分辨率日志和快速调试功能。目前该项目已在狼人杀等复杂场景中取得实验成果,旨在帮助开发者以最小成本提升智能体性能。
原文链接:Linux.do
评论前必须登录!
立即登录 注册