超17万个视频!NVIDIA、苹果等巨头被曝违规用数据训练AI
AI 概述
快科技 7 月 17 日消息,据媒体报道,包括 NVIDIA、苹果、Salesforce 和 Anthropic 在内的多家科技巨头,被曝光涉嫌违规使用数据,用于训练其 AI 模型。
这些公司被发现使用了超过 173536 个 YouTube 视频的字幕数据,而这些数据的获取并未得到视频创作者的许可。
这些公司所使用的数据集名为“YouTube Subtitles”,由非...
快科技 7 月 17 日消息,据媒体报道,包括 NVIDIA、苹果、Salesforce 和 Anthropic 在内的多家科技巨头,被曝光涉嫌违规使用数据,用于训练其 AI 模型。

这些公司被发现使用了超过 173536 个 YouTube 视频的字幕数据,而这些数据的获取并未得到视频创作者的许可。
这些公司所使用的数据集名为“YouTube Subtitles”,由非营利组织 EleutherAI 创建,该数据集包含了来自超过 48000 个频道的视频文本。
其中不乏知名教育机构和媒体公司的内容,例如可汗学院、麻省理工学院、哈佛大学等,此外,一些广受欢迎的 YouTube 创作者,如 MrBeast 等的视频也被包括在内。
此前,EleutherAI 发布了名为“Pile”的数据汇编,其中的大部分数据集都是对公众开放的,包括 YouTube Subtitles。
不过值得注意的是,苹果在使用 Pile 数据集训练 OpenELM 模型时,并未直接下载数据,因此在技术层面上,是 EleutherAI 违反了 YouTube 的使用条款。
YouTube 明确禁止未经授权从平台获取素材,同时这些数据不仅用于训练 AI,还可能涉及到版权和隐私问题。
创作者们也对此表示震惊和不满,因为他们并未被告知自己的作品被用于商业目的,更遑论从中获得任何补偿。
以上关于超17万个视频!NVIDIA、苹果等巨头被曝违规用数据训练AI的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。
声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
重要:如软件存在付费、会员、充值等,均属软件开发者或所属公司行为,与本站无关,网友需自行判断
码云笔记 » 超17万个视频!NVIDIA、苹果等巨头被曝违规用数据训练AI
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
重要:如软件存在付费、会员、充值等,均属软件开发者或所属公司行为,与本站无关,网友需自行判断
码云笔记 » 超17万个视频!NVIDIA、苹果等巨头被曝违规用数据训练AI
微信
支付宝