由企鹅兰登书屋、爱思唯尔和哈珀柯林斯等 13 家主要出版商组成的联盟,在针对影子图书馆 Anna’s Archive 的诉讼中取得了重大胜利。纽约联邦法官杰德·雷科夫签署了缺席判决,完全批准了出版商的请求,判罚 1950 万美元的赔偿金,并发布了广泛的永久禁令。该禁令命令全球二十多个域名注册商、托管服务提供商和主机服务立即停止为该网站提供服务。出版商在诉讼中指出,Anna’s Archive 不仅向公众分享盗版书籍,还充当了 Meta 和 NVIDIA 等 AI 公司的主要训练数据枢纽。由于网站运营者未出庭应诉,法官裁定针对 130 部“诉讼作品”每部赔偿 15 万美元的法定最高赔偿金。尽管判赔金额巨大,但参考此前音乐行业获赔的 3.22 亿美元案件,实际追回资金的可能性极低。此外,法院命令运营者必须在 10 天内披露身份,但鉴于运营者此前为避免长期监禁而隐匿身份,预计其将无视这一要求。本案的真正效力在于对网络基础设施的打击。禁令直接点名 Cloudflare、Njalla、DDOS-Guard 以及格陵兰、巴基斯坦和格林纳达的域名注册机构,要求其停止服务。尽管美国法院的命令对海外实体的约束力有限,且 Anna’s Archive 可能会启用备用域名,但这标志着版权方对 AI 数据源头打击力度的显著升级。
事件分析
本案的核心价值在于将传统的网络盗版打击与 AI 大模型训练的数据合规问题直接挂钩。出版商成功利用法律武器,论证了“影子图书馆”不仅侵犯著作权,更是 AI 巨头如 Meta 和 Nvidia 获取训练数据的非法渠道。这一判决逻辑为后续针对 AI 数据抓取的版权诉讼提供了重要的判例参考,意味着未经授权的数据抓取行为正面临日益严峻的法律责任风险。从技术对抗角度看,美国法院试图通过禁令穿透至底层基础设施,直接管辖全球范围内的域名注册局和 CDN 服务商。这种“去中心化打击”策略旨在切断网站的访问路径,增加其维护成本。然而,由于 Anna’s Archive 的高度抗审查特性及运营者的匿名性,法律判决的实际执行效果存在不确定性。这促使科技行业必须正视数据供应链的合规性,未来 AI 开发者在数据采集环节将面临更严苛的审查,高质量的合法语料库将成为稀缺资源。
💡 核心观点:版权诉讼重创影子图书馆并直指AI训练数据源头,确立了数据供应链的法律红线,迫使大模型厂商必须正视数据合规风险。
原文链接:Hacker News

IT资源栈
评论前必须登录!
立即登录 注册