一位开发者尝试编写一种在未经授权访问时自动删除敏感文件的隐私保护工具,却被 Claude 识别为恶意软件并拒绝协助。Claude 指出,该程序具备自动删除、伪装界面及确保不可恢复等特征,符合勒索软件或数据擦除器的行为模式,存在极高的潜在滥用风险。尽管开发者初衷是保护个人数据,但 AI 安全机制担忧此类工具易被用于破坏他人数据或销毁证据。这一现象反映了 AI 对齐技术中防御性编程与恶意软件边界模糊的难题。
原文链接:Linux.do
一位开发者尝试编写一种在未经授权访问时自动删除敏感文件的隐私保护工具,却被 Claude 识别为恶意软件并拒绝协助。Claude 指出,该程序具备自动删除、伪装界面及确保不可恢复等特征,符合勒索软件或数据擦除器的行为模式,存在极高的潜在滥用风险。尽管开发者初衷是保护个人数据,但 AI 安全机制担忧此类工具易被用于破坏他人数据或销毁证据。这一现象反映了 AI 对齐技术中防御性编程与恶意软件边界模糊的难题。
原文链接:Linux.do
评论前必须登录!
立即登录 注册