谷歌遭遇集体诉讼，被指窃取数亿美国人的网上数据用于训练 AI

作者 | IT之家2023-07-13

7 月 13 日消息，一项新的诉讼指控谷歌(Google)在未经用户知情或同意的情况下，窃取了人们的数据，用来训练其人工智能(AI)产品，如其聊天机器人 Bard。诉讼称，谷歌“秘密地窃取了数亿美国人在互联网上创作和分享的一切”。

这项集体诉讼于周二由克拉克森律师事务所(Clarkson Law Firm)在加利福尼亚北区联邦法院提起，指控谷歌、其 AI 子公司 DeepMind 和母公司 Alphabet 窃取了人们的数据。诉讼声称，“谷歌拿走了我们所有的个人和专业信息、我们的创意和版权作品、我们的照片，甚至我们的电子邮件 —— 几乎是我们数字足迹的全部”，用来构建其 AI 产品。“多年来，谷歌秘密地收集了这些数据，没有向任何人通知或征得同意。”

诉讼还指称，谷歌从基于订阅的网站和以盗版书籍和创意作品而闻名的网站窃取了数据。诉讼还提到了谷歌 7 月 1 日对其隐私政策的更新，该政策称，该公司可能会收集“公开在线”可用的信息，用来训练其 AI 模型，并构建谷歌翻译(Google Translate)、Bard 和云端 AI(Cloud AI)等产品。

诉讼称：“谷歌必须明白：它并不拥有互联网，它也不拥有我们的创意作品、我们的个性表达、我们的家庭和孩子的照片，或者任何其他因为我们在网上分享而属于我们的东西。‘公开可用’从来不意味着可以为任何目的免费使用。”

谷歌在一份发给路透社的声明中，称诉讼中的指控“毫无根据”。谷歌总法律顾问哈利玛・德莱恩・普拉多(Halimah DeLaine Prado)在一份声明中告诉 Insider，该公司“多年来一直明确”表示，使用来自公共来源的数据，如发布到开放网络和公共数据集上的数据，来训练谷歌翻译等服务背后的人工智能模型，“并且符合我们的 AI 原则(AI Principles)”。

德莱恩・普拉多还称：“美国法律支持使用公开信息来创造新的有益用途，我们期待驳回这些毫无根据的指控。”

克拉克森律师事务所在两周前还对 OpenAI 提起了类似投诉，该投诉指控该公司窃取了“大量个人数据”，并用它来训练 ChatGPT，包括医疗记录和关于儿童的信息。

谷歌这起诉讼中的一名原告据悉是一名住在得克萨斯州的《纽约时报》畅销书作者和调查记者，她声称谷歌使用了她的书的盗版 PDF 来训练 Bard。诉讼称，她的作品现在在 Bard 上广泛免费提供，该机器人给出了书的章节摘要，甚至逐字分享了书中的片段。