Anthropic宣布开源其原始编程性能测试题。随着Claude Opus 4.5在两小时内的表现已超越人类专家,该公司现邀请开发者在无限时间内挑战这一基准。数据显示,Claude Opus 4.5在特定测试时计算条件下表现优异。若开发者能优化至1487周期以下,不仅证明人类潜能,还将直接获得Anthropic的面试机会。
原文链接:Hacker News
Anthropic宣布开源其原始编程性能测试题。随着Claude Opus 4.5在两小时内的表现已超越人类专家,该公司现邀请开发者在无限时间内挑战这一基准。数据显示,Claude Opus 4.5在特定测试时计算条件下表现优异。若开发者能优化至1487周期以下,不仅证明人类潜能,还将直接获得Anthropic的面试机会。
原文链接:Hacker News
评论前必须登录!
立即登录 注册