据报道,英伟达数据战略团队曾主动接触知名“影子图书馆” Anna’s Archive,寻求合作。英伟达明确表示希望将其拥有的数百万盗版电子书纳入大语言模型的预训练数据集。此外,英伟达还咨询了如何付费获取该网站的高速访问权限。这一消息暴露了科技巨头在 AI 训练数据获取方面的激进策略及潜在的版权法律风险,引发了行业对数据来源合规性的高度关注。
原文链接:Linux.do
据报道,英伟达数据战略团队曾主动接触知名“影子图书馆” Anna’s Archive,寻求合作。英伟达明确表示希望将其拥有的数百万盗版电子书纳入大语言模型的预训练数据集。此外,英伟达还咨询了如何付费获取该网站的高速访问权限。这一消息暴露了科技巨头在 AI 训练数据获取方面的激进策略及潜在的版权法律风险,引发了行业对数据来源合规性的高度关注。
原文链接:Linux.do
评论前必须登录!
立即登录 注册