Afin d’entraîner leurs systèmes d’intelligence artificielle, les entreprises puisent librement du contenu sur Internet. Mais cette fois, il semblerait qu’OpenAI et Meta soient allés trop loin.
L’intelligence artificielle est désormais capable de tout, et même de producteur d’oeuvres d’art. Une fausse photographie délivrée par l’IA a d’ailleurs remporté un prestigieux concours. Et bien que l’IA ne devrait pas avoir le droit de remporter un Grammy Awards, elle est déjà utilisée pour un RPG entièrement alimenté par cette technologie. Cependant, la collecte massive de données sur Internet semble problématique.
Crédit photo : Unsplash
Sarah Silverman, comédienne et auteure, ainsi que les auteurs Christopher Golden et Richard Kadrey, ont ainsi intentionné des poursuites contre OpenAI et Meta. Les artistes affirment que les entreprises ont utilisé leurs œuvres pour entraîner leurs modèles d’intelligence artificielle sans avoir obtenu leur consentement, poursuivant OpenAI et Meta pour violation des droits d’auteur.
ChatGPT résume le livre de la pensée
Les poursuites allèguent, entre autres, que le ChatGPT d’OpenAI et le LLaMA de Meta ont été entraînés sur des ensembles de données illégalement acquis contenant les œuvres des suspects. Selon eux, ces œuvres ont été acquises sur des sites web de « bibliothèques fantômes » tels que liotik, Library Genesis, Z-Library Bibet d’autres, notant que les livres sont « disponibles en masse via des systèmes de torrents ».
Les écrivains ont ainsi soumis des pièces à conviction qui ont démontré que ChatGPT résume leurs livres lorsqu’on le lui demande, violant ainsi leurs droits d’auteur. Le livre Bedwetter de Silverman est le premier à être résumé par ChatGPT dans les pièces à conviction, tandis que le livre Ararat de Golden est également utilisé comme exemple.
Dans le procès intentionné à Meta, les trois auteurs affirment que leurs livres ont été inclus dans les ensembles de données utilisés par Meta pour entraîner ses modèles LLaMA. Les auteurs nécessitant que l’utilisation non autorisée de leurs livres dans les ensembles de données d’entraînement de Meta constituent une violation du droit d’auteur, ce qui constitue la base de leur plainte en justice.
Dans les deux actions en justice, les auteurs déclarent qu’ils n’ont pas consenti à l’utilisation de leurs livres protégés par le droit d’auteur comme matériel d’entraînement pour les modèles d’intelligence artificielle des entreprises.
Source : theverge