
我它使用Instagram和Facebook的公开照片和文本来训练它的人工智能文本到图像生成器。
我该公司高管克里斯·考克斯在彭博科技峰会上表示,该公司不会“培训私人事务”。
这位首席产品官发表上述言论之际,大型科技公司正竞相获取数据来训练人工智能模型。
大型科技公司正在争夺人工智能训练数据,而meta似乎比竞争对手有一个很大的优势:使用Instagram和Facebook的照片。
meta的首席产品官克里斯·考克斯周四在彭博科技峰会上表示,该公司使用平台上公开的照片和文本来训练名为Emu的文本到图像生成器模型。
他说:“我们不训练私人的东西,我们不训练人们与朋友分享的东西,我们训练的是公开的东西。”
本文仅对Business Insider订阅者开放。成为业内人士,现在就开始阅读。有账户吗?.
有关的故事
考克斯补充说,meta的文本到图像模式可以产生“非常高质量的图像”,因为Instagram上有很多“艺术、时尚、文化的照片,也有很多人和我们的照片”。
据其网站介绍,用户可以通过输入以“想象”开头的提示,在元人工智能上创建图像,它将生成四张图像。
人工智能模型需要接受数据的喂养和训练,才能发挥作用。这是一个有争议的问题,因为几乎没有办法阻止受版权保护的内容从互联网上被抓取并用于创建法学硕士。
然而,自去年年初以来,美国版权局一直在试图处理这个问题,并正在考虑更新其法律来解决这个问题。
公司试图获取数据的一种方式是与其他公司合作。例如,OpenAI已与多家媒体合作,授权其内容并开发其模型。
《纽约时报》上月报道称,meta甚至考虑收购出版商西蒙与舒斯特(Simon & Schuster),以获得更多数据来训练其模型。
除了原始数据集,公司还使用“反馈循环”——从过去的互动和输出中收集的数据,并对其进行分析,以提高未来的表现——来训练他们的模型。它包括在出现错误时通知人工智能模型的算法,以便从中吸取教训。
meta首席执行官马克·扎克伯格上个月告诉The Verge,反馈循环将比任何“预先语料库”“更有价值”。
meta没有立即回应Business Insider在正常工作时间之外提出的置评请求。








