安全公司XBOW对OpenAI即将发布的GPT-5.5进行了深度实战测评。数据显示,相较于GPT-5(40%漏报率)和Opus 4.6(18%漏报率),GPT-5.5将漏洞漏报率大幅降至10%。最令人震惊的是其推理能力的质变:在不查看源代码的“黑盒”状态下,其表现已超越了拥有源代码辅助的上一代模型;而在“白盒”测试中,它更是直接“击穿”了现有基准。此外,该模型在智能体决策效率上显著提升,能更快速地判断何时坚持或放弃,极大地提高了自动化渗透测试的实际效能。
原文链接:Hacker News
安全公司XBOW对OpenAI即将发布的GPT-5.5进行了深度实战测评。数据显示,相较于GPT-5(40%漏报率)和Opus 4.6(18%漏报率),GPT-5.5将漏洞漏报率大幅降至10%。最令人震惊的是其推理能力的质变:在不查看源代码的“黑盒”状态下,其表现已超越了拥有源代码辅助的上一代模型;而在“白盒”测试中,它更是直接“击穿”了现有基准。此外,该模型在智能体决策效率上显著提升,能更快速地判断何时坚持或放弃,极大地提高了自动化渗透测试的实际效能。
原文链接:Hacker News
评论前必须登录!
立即登录 注册