为训练AI不择手段!Meta被曝下载数十TB盗版电子书
创始人
2026-01-25 15:01:08
0

最近,有报道指出Meta公司为了训练其人工智能系统,可能下载了数十TB的电子书数据。然而,这些数据中很大一部分可能是通过非正规渠道获取的,涉嫌侵犯版权。这一行为引发了广泛争议,有人认为这是推动技术进步的重要步骤,也有人担忧这将对知识产权保护造成严重冲击。Meta公司尚未对此事作出正式回应,但该事件已经引起了科技界和法律界的广泛关注。如何在促进技术创新与保护知识产权之间找到平衡点,成为了当前亟待解决的问题。

此事件提醒我们,在追求先进技术的同时,必须严格遵守法律法规,尊重他人的知识产权。对于企业而言,应采取合法合规的方式收集数据,确保研发过程的透明度和公正性。同时,政府和相关机构也需要完善相应的法律法规,以适应快速发展的数字时代需求。

快科技2月9日消息,据媒体报道,一名图书作者对Meta提起诉讼,指控该公司未经授权下载了大量盗版电子书,用于训练其AI模型。

最新泄露的邮件显示,Meta承认下载了一个有争议的大型数据集LibGen,其中包括数千万本盗版书籍。

根据法庭文件,Meta通过名为安娜的档案”(Annas Archive)的渠道下载了至少81.7TB的数据,其中包括来自知名盗版网站Z-Library和LibGen的至少35.7TB的内容,Meta还被指此前从LibGen下载了额外的80.6TB数据。

作者指出,Meta的这一行为构成了非法的电子书库种子下载,且这一数字可能只是其盗版行为的冰山一角。

作者估计,这些盗版电子书库可能仅占Meta盗版版权作品总量的0.008%,这表明Meta的盗版规模可能远超目前所揭露的。

邮件还显示,Meta公司员工也意识到其行为的法律风险,2023年4月,Meta的研究工程师尼古拉巴什利科夫在邮件中表示:用公司的笔记本电脑下BT感觉不妥。”

到2023年9月,巴什科夫加大了抗议力度,并咨询了法律团队,他指出,使用Torrents意味着对文件进行播种”,即对外共享内容,这在法律上是不允许的。

但Meta仍决定继续,并试图通过将数据集下载到非Meta服务器来避免被追溯的风险。




相关内容

热门资讯

长征五号B遥一运载火箭顺利通过... 2020年1月19日,长征五号B遥一运载火箭顺利通过了航天科技集团有限公司在北京组织的出厂评审。目前...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
湖北省黄冈市人大常委会原党组成... 据湖北省纪委监委消息:经湖北省纪委监委审查调查,黄冈市人大常委会原党组成员、副主任吴美景丧失理想信念...
《大江大河2》剧组暂停拍摄工作... 搜狐娱乐讯 今天下午,《大江大河2》剧组发布公告,称当前防控疫情是重中之重的任务,为了避免剧组工作人...