根据 IEEE Spectrum 报道,最新研究揭露了当前语音 AI 系统面临的一个严重安全隐患。研究人员证实,攻击者可以利用人类听觉范围之外的音频信号(主要是超声波),成功“劫持”语音 AI 模型的行为。这种攻击方式利用了麦克风硬件的非线性特性,使得原本应该被过滤的超声波信号在麦克风内部被解调为可被系统识别的语音指令。测试显示,包括大模型(LLM)驱动的语音助手在内的多种系统均容易受到此类“隐藏音频攻击”的影响。攻击者可以在用户毫无察觉的情况下,通过播放一段包含恶意指令的静音或白噪音,诱导 AI 执行未经授权的操作,如拨打电话、访问敏感信息甚至控制智能家居设备。这一发现对日益普及的 AI 智能体(Agent)构成了实质性威胁,表明仅依靠软件层面的防护不足以抵御物理层面的信号注入,迫使开发团队必须在硬件和信号处理层面重新审视音频接口的安全性。
事件分析
从技术原理分析,此类攻击并未攻破模型的算法逻辑,而是利用了物理感知层的漏洞。麦克风放大器电路的非线性响应导致高频超声波发生混叠,转化为系统可接受的伪声音信号。随着大模型(LLM)与语音交互的深度融合,攻击面已从简单的指令执行扩展到通过提示词工程诱导模型进行复杂推理,潜在的破坏力呈指数级上升。这标志着 AI 安全攻防已从纯数字空间延伸至物理信号空间,未来的安全架构必须在模数转换(ADC)前端增加针对特定频谱的带阻滤波,或在算法层引入对抗性音频样本的鲁棒性训练,以应对物理世界对抗样本的挑战。
💡 核心观点:隐蔽音频攻击揭示了AI感知硬件的物理盲区,多模态安全防御亟需从算法层下沉至信号处理层。
原文链接:Hacker News

IT资源栈
评论前必须登录!
立即登录 注册