Anthropic 发布了 Skill Creator 重大更新,旨在解决 Agent 技能开发和测试的痛点。新增功能包括:自动化评估,无需编写代码即可定义测试用例并追踪通过率及性能,防止模型更新导致的技能“退步”;多 Agent 并行测试,提高测试效率并实现独立数据追踪;A/B 盲测对比,通过“比较器 Agent”客观评估不同版本技能的优劣;触发率优化,利用 AI 分析技能描述以减少误触发。这些工具让 Claude Agent 的开发从“凭感觉”转向“凭数据”,显著提升了技能的可靠性和开发效率。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册