AI安全对齐的“误伤”:本地渗透测试作业竟遭Claude/GPT风控拦截

一名信息安全专业的学生在Linux.do发帖求助,称在完成本地虚拟机渗透测试作业时,利用Claude Code或GPT辅助编写攻击脚本遭遇持续的风控拦截。尽管用户反复强调操作对象仅为本地靶机且用于学术目的,AI模型仍因检测到敏感关键词而触发防御机制。该事件引发了广泛关注,折射出当前大模型在安全对齐策略上的“一刀切”弊端,即过度防御导致了对合法网络安全教育与科研活动的阻碍,引发了对AI如何精准识别攻击语境的思考。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册