不看代码也能找漏洞 GPT 5.4 Cyber 一出 银行和安全团队先坐不住了

Banner

写在前面

OpenAI 这次放出来的新东西,不是大家一直在等的 GPT-6,而是一个更敏感、也更容易引发误解的方向:面向防御性网络安全的专用模型 GPT-5.4-Cyber。

消息一出,外面的反应很快就分成了两拨。一拨是熟悉的惊悚叙事,什么“AI 蝗灾”“终结者觉醒”,仿佛下一秒所有网页和系统都会被机器看穿;另一拨则更现实,开始盯着访问权限、使用边界和实际风险,判断这是不是网络安全攻防的新拐点。

真正值得看的,不是耸动标题,而是这类模型正在把网络安全从“人找漏洞”推向“机器找漏洞、机器修漏洞”的新阶段。


新增二进制逆向工程能力,但这次只给专家用

先看 GPT-5.4-Cyber 本身。

OpenAI 给它的定义很明确:这是 GPT-5.4 的一个优化版本,功能限制更少,网络安全能力更强,目标是降低合法网络安全工作的准入门槛,同时补齐高级防御工作流里的关键能力。

这次最受关注的,是它新增了二进制逆向工程功能。这意味着它不一定非要看原始代码,拿到编译后的底层文件,也能直接分析其中可能存在的安全漏洞。对安全团队来说,这比传统通用模型更接近真实工作场景,因为很多时候摆在面前的就是可执行文件、固件、组件包,而不是一整套干净完整的源码。

OpenAI 图示

另一个变化是回答边界明显放宽了。过去你拿通用模型去问系统漏洞、压力测试、攻击路径,它经常会直接拒答;这次 OpenAI 做的是面向防御场景的定向放开,让模型在安全专家的合法工作流里更愿意配合。

当然,这种能力不可能全面公开。GPT-5.4-Cyber 目前只向经过认证的网络安全专业人士、企业团队和可信客户开放。个人访问要先经过身份验证,企业则需要通过团队申请流程获得权限。也就是说,OpenAI 的态度不是把这类能力推向大众,而是把它放进一个严格受控的专业通道里。

OpenAI 访问说明

这也解释了为什么外界一边震动,一边又没有真正失控:能力上去了,但开放范围没有一起放开。


一周前,Anthropic 也刚把 Claude Mythos 推到台前

这件事之所以更有讨论度,很大程度上是因为它不是单独发生的。

就在 GPT-5.4-Cyber 发布前一周,Anthropic 刚刚放出 Claude Mythos 预览版。两家的路线不完全一样,但指向几乎一致:大模型正在深入网络安全攻防,而且速度比很多人预期更快。

Anthropic 这边的做法甚至更保守。Claude Mythos 没有直接对外开放,而是先放在封闭环境里使用。按照公开测试信息,它在内部测试中已经能自主挖出操作系统、浏览器和开源系统里的未知漏洞,甚至翻出了埋了二十多年的老漏洞。

Anthropic 图示

如果把这两件事放在一起看,信号就很清楚了:过去找漏洞,主要还是顶尖安全研究员靠经验、工具和时间硬啃;现在开始变成 AI 长时间持续扫描、分析、比对,再把结果交给安全团队处理。

攻防两端的门槛都在变化。攻击方会更便宜、更自动化,防守方也必须用同样的机器能力补上响应速度,否则就会被越来越密集的漏洞发现和利用节奏压垮。

这也是为什么很多人会把这轮变化概括成“机器对决机器”的开端。


政府、银行和企业最担心的,不是概念,而是现实风险

技术圈可以用热梗消化焦虑,政府和金融机构就没这么轻松了。

英国方面已经在召集银行、保险公司和交易所代表讨论这类模型的潜在网络风险;美国财政系统也在和华尔街主要银行开会,评估同类能力带来的冲击。原因不复杂:一旦这类模型把漏洞分析、样本理解和攻击链拼装做得更快,金融系统和关键基础设施就会成为最需要提前准备的一批对象。

公开案例也在强化这种紧张感。以色列初创公司 Tenzai 的 AI 工具参加黑客竞赛时,模型表现已经优于超过 99% 的人类参赛者;谷歌此前也发现过能够在运行时直接连接大模型生成恶意脚本的样本。

风险讨论

换句话说,AI 在网络安全领域带来的冲击已经不是抽象讨论,而是开始进入制度、金融和企业安全治理层面的真实议题。


但也没必要把它神化:大多数攻击,根本不是从漏洞开始的

真正需要冷静看的,是这类模型到底改变了什么、又没有改变什么。

它改变的是效率、速度和成本。以前很多需要安全专家花几天、几周才能完成的分析工作,现在可能被压缩到更短时间里;以前需要高水平研究员才能做的事情,以后可能有更多团队能做。

但它没有把网络安全的全部逻辑改写掉。按照 Root Evidence CEO 杰里迈亚·格罗斯曼的说法,目前业内实际网络攻击中,只有 10% 到 20% 是从软件漏洞利用开始的,大多数攻击仍然来自网络钓鱼和社会工程。

这组数据很关键。因为它说明,再强的漏洞分析模型,也不是今天网络攻击的唯一核心变量。很多企业真正的薄弱点,仍然是员工账号密码泄露、钓鱼邮件点击、权限管理松散和修复节奏过慢。

Sophos《2025 年勒索软件状况报告》也给出了类似信号:在操作因素导致的攻击里,缺乏专业知识占 40.2%,人员或能力不足占 39.4%。

Sophos 数据

所以,AI 网络安全模型不是“凭空创造了新的灾难”,而是把旧有攻击与防御流程整体加速了。它让原本就存在的问题更快暴露,也让原本就低效的修复流程更难拖下去。


企业真正要补的,不只是模型能力,而是修复速度

从企业视角看,这轮变化最直接的影响不是“要不要用”,而是“修补得够不够快”。

如果漏洞发现速度被 AI 大幅提高,而企业打补丁、分级处置、排优先级的节奏还停留在过去,那么问题就不在于模型太强,而在于内部安全流程太慢。Claude Mythos 被提到的一个现实问题,就是它可能一次性识别出大量漏洞,反而让安全团队更难快速排定修复优先级,造成漏洞积压。

这其实很现实:机器把问题找得更快,不代表组织就能同样快地消化问题。很多企业接下来真正比拼的,会是漏洞管理、补丁响应、人员协同和自动化修复能力,而不是谁先喊出“我们接入了 AI 安全模型”。

对普通用户来说,结论反而更朴素。网络世界里最脆弱的地方,很多时候不是代码,而是人本身。账号口令、双重验证、钓鱼识别、最小权限,这些老问题并没有因为新模型出现就自动消失。


这类模型到底该怎么理解

如果把 GPT-5.4-Cyber 和 Claude Mythos 放在一起看,它们更像是两家大模型公司在同一个方向上的同步推进:把通用模型往高风险、高专业度、高门槛的网络安全场景里推。

它们不是给普通用户日常聊天用的功能升级,也不是简单的“会写点安全脚本”。更准确地说,这是一类面向专业安全团队的 AI 安全工作模型,重点能力包括:

  • 分析二进制和底层文件
  • 理解漏洞利用链和防御流程
  • 参与压力测试、样本分析、漏洞排查
  • 加速安全研究和修复优先级判断

从公开信息来看,这类能力目前都带着很强的访问限制。OpenAI 采用认证和可信访问机制,Anthropic 对更敏感的版本则采取更封闭的控制方式。它们共同说明一件事:越强的安全能力,越不可能像普通聊天模型那样广泛开放。

不过说实话,官方使用对国内用户并不算友好——不管是账号体系、支付方式还是网络环境,门槛都不低。如果你平时更想先稳定用上 Claude、GPT 这类主流模型做开发和研究,而不想反复折腾官方链路,可以看看 Code80,真实订阅帐号转 API,换个 endpoint 就能直接用,体验跟官方一样。详情可以到官网了解:code.ai80.vip


常见问题

1. GPT-5.4-Cyber 和普通 GPT 模型最大的区别是什么?

最大的区别在于,它不是面向通用聊天或内容生成做优化,而是围绕防御性网络安全场景做了定向增强,尤其补上了二进制逆向工程和更宽松的安全分析能力。

2. 这是不是意味着以后 AI 可以随便找漏洞了?

不是。能力确实变强了,但开放范围仍然非常受控。目前这类模型主要面向经过认证的安全专业人士和企业团队,不是全面公开的普通工具。

3. Claude Mythos 和 GPT-5.4-Cyber 是同一类东西吗?

大方向上很接近,都是把大模型推向更专业的网络安全攻防场景;但两家在开放策略上不完全一样,Anthropic 对更高风险能力的控制看起来更保守。

4. 企业现在最该担心什么?

不是一句“AI 太危险”,而是自己的修复链路够不够快。漏洞发现速度提升后,补丁响应、优先级管理和安全协同能力会变得更关键。

5. 普通用户需要因为这类新闻特别恐慌吗?

没必要。现实里大量攻击依然来自钓鱼、密码泄露和社会工程。对个人来说,复杂密码、双重验证和基本安全习惯,仍然是最有效的防线。

6. 国内开发者如果想更方便地使用 Claude 或 GPT 怎么办?

如果走官方路线,通常要处理支付、账号和网络环境这些现实问题。国内用户可以通过 Code80 更方便地使用。

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册