针对AI公司大规模抓取网络数据的行为,开发者推出了名为Miasma的开源反击工具。该工具通过在网站中植入人类不可见的隐藏链接,将AI爬虫诱骗至一个“数据毒药池”。在这个陷阱中,爬虫将陷入无限循环,并获取大量无意义的垃圾数据。Miasma基于Rust构建,轻量且高效,旨在通过污染训练数据的方式,帮助网站主防御AI模型的恶意掠夺,开启了数据所有者与AI巨头之间的技术博弈。
原文链接:Hacker News
针对AI公司大规模抓取网络数据的行为,开发者推出了名为Miasma的开源反击工具。该工具通过在网站中植入人类不可见的隐藏链接,将AI爬虫诱骗至一个“数据毒药池”。在这个陷阱中,爬虫将陷入无限循环,并获取大量无意义的垃圾数据。Miasma基于Rust构建,轻量且高效,旨在通过污染训练数据的方式,帮助网站主防御AI模型的恶意掠夺,开启了数据所有者与AI巨头之间的技术博弈。
原文链接:Hacker News
评论前必须登录!
立即登录 注册