OpenAI a été accusé par The New York Times d’avoir “manipulé intentionnellement” son chatbot pour régurgiter des lignes entières issues des articles du journal, alors qu’il lutte contre une action en justice pour droit d’auteur de la part du journal, ce qui représente une menace pour le développement de sa technologie.
L’action en justice, déposée juste après Noël, était “sans fondement”, selon un billet de blog publié par l’entreprise d’intelligence artificielle lundi, qui ajoutait que le journal ne “racontait pas toute l’histoire”.
Dans l’action en justice déposée le 27 décembre, l’entreprise médiatique américaine a accusé la start-up IA et son principal soutien, Microsoft, de profiter gratuitement en utilisant des millions d’articles pour construire sa technologie de chatbot, capable de répondre en détail aux sollicitations en langage naturel.
Le droit d’auteur est un problème de plus en plus épineux pour les entreprises d’IA telles que OpenAI, dont les modèles fonctionnent en ingérant d’énormes quantités de données à travers l’internet. La poursuite, qui réclame des milliards de dollars de dommages-intérêts, prétend qu’OpenAI a profité de “l’exploitation et de l’appropriation indue de la propriété intellectuelle du Times”.
Cela a été suivi par une action de classe proposée par une paire d’auteurs de non-fiction, qui prétendent qu’OpenAI a enfreint leur droit d’auteur en formant son grand modèle de langage sur leur travail. Des auteurs de fiction notables, incluant John Grisham et Jodi Picoult, ont précédemment déposé une plainte similaire.
Dans son blog, OpenAI affirme avoir appris pour la première fois l’existence du procès intenté par le Times à travers un article de presse publié par le journal le 27 décembre. Avant cela, elle prétend avoir été engagée dans des discussions productives avec l’organisation médiatique au sujet d’un partenariat, et avait expliqué que le contenu du Times “ne contribuait pas de manière significative à l’entraînement de nos modèles existants”.
Dans son affaire de droits d’auteur, le Times a accusé le chatbot d’OpenAI de régurgiter des extraits entiers de ses articles – un phénomène décrit par OpenAI comme une “mémorisation involontaire”, que la société a explicitement tenté d’éviter.
Le Times a également demandé à OpenAI de détruire toutes les données d’entraînement et les modèles de chatbot qui avaient utilisé son matériel protégé par le droit d’auteur.
Les exemples avancés par le Times proviennent d’anciens articles qui ont été publiés sur un certain nombre de sites tiers, selon OpenAI. “Il semble que [le Times] ait intentionnellement manipulé les instructions, incluant souvent de longs extraits d’articles, afin d’obtenir que notre modèle régurgite.”
“Nos modèles ne se comportent généralement pas de la manière dont le New York Times le sous-entend, ce qui suggère qu’ils ont soit instruit le modèle de régurgiter, soit sélectionné leurs exemples parmi de nombreuses tentatives”, a écrit OpenAI.
“Le blog concède qu’OpenAI a utilisé le travail du Times, ainsi que celui de nombreux autres, pour construire ChatGPT”, a déclaré Ian Crosby, associé chez Susman Godfrey, qui représente le New York Times.
OpenAI avait cherché “à profiter gratuitement de l’investissement massif du Times dans son journalisme en l’utilisant pour construire des produits substitutifs sans autorisation ni paiement”, selon la plainte de l’entreprise.
“Cela ne relève en aucun cas de l’usage équitable, quelle que soit la mesure”, a ajouté Crosby.
OpenAI et d’autres entreprises d’IA ont soutenu que le traitement de grandes quantités de données disponibles publiquement sur Internet constitue une utilisation équitable protégée par la loi sur le droit d’auteur aux États-Unis. Le conflit en gestation survient alors qu’OpenAI cherche à conclure une série d’accords avec d’autres organisations de presse pour obtenir une licence de leur contenu. Début décembre, la société a conclu un accord historique avec l’éditeur allemand Axel Springer, d’une valeur de dizaines de millions d’euros par an, qui pourrait servir de modèle pour de futures collaborations entre les éditeurs et les entreprises d’IA.
“Nous considérons que le procès intenté par le New York Times est sans fondement. Néanmoins, nous sommes optimistes quant à un partenariat constructif avec le New York Times et nous respectons son long passé”, a écrit OpenAI dans le blog de lundi.
No Responses