La décision concernant Sarah Silverman montre les résultats de ChatGPT

Les auteurs, journalistes, musiciens et autres continuent de contester l’utilisation de leurs œuvres créatives comme entrée d’entraînement pour l’industrie florissante de l’intelligence artificielle générative, et une décision le mois dernier fournit des orientations sur le contenu des preuves que les créateurs de contenu préoccupés par la violation du droit d’auteur devraient produire.

Le 12 février, la juge Araceli Martínez-Olguín a rendu un jugement dans une affaire portée par un groupe d’auteurs, y compris la comédienne Sarah Silverman, contre OpenAI, le développeur du chatbot populaire ChatGPT, rejetant la plainte des plaignants pour violation indirecte du droit d’auteur. L’opinion montre que les plaignants potentiels devraient se concentrer sur le travail créé par le chatbot, et non juste sur la copie elle-même.

Pour maintenir une revendication d’infraction par procuration réussie, le plaignant doit prouver que le défendeur a créé une œuvre qui a copié au moins certains aspects de l’œuvre protégée par le droit d’auteur. Cette exigence est satisfaite en montrant que le défendeur a directement copié l’œuvre du plaignant et a produit quelque chose qui ressemble ou sonne pareil.

Dans les cas où l’infraction est moins flagrante, les plaignants peuvent se concentrer sur les similitudes substantielles entre l’œuvre prétendument contrefaisante et l’œuvre originale protégée par le droit d’auteur.

Ici, le rejet de la revendication d’infraction par procuration par le juge repose sur ce concept de similitude substantielle entre les œuvres copiées et ce qu’OpenAI a créé. Silverman et les autres plaignants affirment qu’ils n’ont pas besoin de montrer une similitude substantielle parce qu’ils ont des preuves de copie directe, c’est-à-dire des preuves qu’OpenAI a directement copié le texte de leurs livres pour entraîner son grand modèle de langage.

Mais cela manque de pertinence. Bien qu’OpenAI ait directement copié ces livres des plaignants comme entrée pour ses modèles, le contenu prétendument contrefaisant en question sont les sorties de ChatGPT.

Les plaignants allèguent que ces sorties sont des œuvres dérivées de leurs matériaux protégés par le droit d’auteur (et, donc, toujours contrefaisantes), mais le juge a estimé qu’ils n’ont pas spécifiquement et adéquatement allégué des similitudes substantielles. Dans leur plainte originale, Silverman et les autres plaignants affirment qu’OpenAI a directement copié le texte de leurs œuvres originales, qui a ensuite été « ingéré » par ChatGPT. En raison de cette prétendue copie directe, ChatGPT a ensuite pu cracher des « résumés très précis » de leurs livres.

L'affaire est Silverman et autres contre OpenAI

Il est notable que les plaignants ne prétendent jamais que les sorties de ChatGPT contiennent des copies directes de textes de leurs livres. Les plaignants pointent spécifiquement le fait que les sorties « commettent des erreurs sur certains détails » parce que le modèle de ChatGPT « mélange des matériaux expressifs provenant de nombreuses sources ».

Malheureusement pour Silverman et les autres plaignants, ce mélange de matériaux expressifs est exactement le type de sortie que le droit d’auteur est destiné à protéger. Le droit d’auteur ne protège pas les concepts, les idées ou les thèmes ; il protège plutôt l’expression spécifique d’une idée.

Par exemple, un auteur écrivant la biographie d’une personne célèbre sera influencé, informé et guidé – en d’autres termes, formé – par des livres antérieurs, des articles de presse et d’autres récits écrits de la vie du sujet. Ces auteurs antérieurs ne peuvent alors pas prétendre que le biographe a violé leurs droits d’auteur en racontant la même histoire d’une manière différente.

Ce concept est clé pour la promotion par la Constitution des États-Unis du progrès des « Arts utiles ». Au cœur de ce principe de progrès se trouve l’idée que tout nouvel art se construit sur l’art antérieur. Bien que fondamentale pour le droit d’auteur aux États-Unis, cette idée précède tous les idéaux artistiques américains. Les philosophes ont longuement débattu si l’art est création ou, plutôt, simplement imitation du monde naturel.

Au-delà du débat philosophique, tout art continue de se construire sur ce qui l’a précédé. Gavin Alexander, professeur de littérature de la Renaissance à l’Université de Cambridge, explique l’impact des mots et expressions uniques de John Milton sur les innombrables créateurs qui se sont appuyés sur ses œuvres : « Comme avec Shakespeare, dont des fragments de vers sont éparpillés dans les titres de romans et de films, des expressions miltoniennes se retrouvent – parfois délibérément évoquées, et parfois sans idée de leur origine – dans les œuvres de fiction moderne, de film, de musique et d’art. »

Ici, les résumés des livres des plaignants générés par ChatGPT sont semblables au travail du biographe décrit ci-dessus. Ce n’est pas une violation du droit d’auteur pour le modèle IA d’ingérer les œuvres des auteurs, tout comme ce n’est pas une violation pour le biographe de lire des travaux antérieurs sur la vie de son sujet, tant que ChatGPT et le biographe utilisent les matériaux protégés par le droit d’auteur pour créer une nouvelle expression originale.

Ainsi, le succès de Silverman et des autres plaignants dépendra de la disponibilité de preuves montrant que les sorties de ChatGPT contiennent du matériel qui copie directement au moins des parties de leurs livres. Dans ce cas, il n’est pas clair si de telles preuves existent.

D’autres plaignants dans des affaires similaires peuvent être mieux positionnés pour réussir. Par exemple, le New York Times a déposé une plainte dans le District Sud de New York en décembre, alléguant que les outils d’IA générative, y compris OpenAI et Copilot, créent des sorties qui non seulement résument le contenu du Times mais le récitent mot pour mot. De même, un grand groupe d’éditeurs de musique a déposé une plainte en octobre dernier dans le District du Milieu du Tennessee, affirmant que le chatbot « Claude » de la compagnie d’IA Anthropic génère des sorties avec des copies « identiques ou presque identiques » des paroles détenues par les plaignants.

Alors que les auteurs, artistes, musiciens et autres créateurs continuent de contester les manières dont les compagnies d’IA utilisent et exploitent leurs matériaux protégés par le droit d’auteur, les plaignants devraient soigneusement considérer si et comment ces modèles d’IA copient leurs œuvres et être prêts à présenter des preuves de copie directe ou, à tout le moins, une similitude substantielle.

Tags:

No Responses

Leave a Reply

Your email address will not be published. Required fields are marked *

BLOG

NARA interdit l'utilisation de ChatGPT sur les réseaux de l'agence

NARA interdit l’utilisation de ChatGPT sur les réseaux de l’agence

Les Archives nationales et l’Administration des dossiers ont été la dernière agence fédérale à interdire à ses employés d’utiliser ChatGPT à des fins professionnelles, invoquant un “risque inacceptable” pour les données de l’agence. La décision politique découle des préoccupations des responsables de l’agence selon lesquelles les données que les employés saisissent comme stimuli dans la […]

La violation continue des droits d'auteur est une douleur pour Microsoft et OpenAI

La violation continue des droits d’auteur est une douleur pour Microsoft et OpenAI

Microsoft et OpenAI ont été frappés par une poursuite déposée par huit éditeurs de journaux concernant des problèmes liés au droit d’auteur. Ce que vous devez savoir Microsoft et OpenAI ont été visés par une poursuite déposée par huit éditeurs de journaux pour des problèmes de violation du droit d’auteur. Copilot et ChatGPT ont été […]

OpenAI permet désormais de stocker l’historique de ChatGPT sans aucune condition

Auparavant, les utilisateurs de ChatGPT ne pouvaient conserver leur historique de conversation que s’ils acceptaient que OpenAI utilise leurs données à des fins de formation. Cependant, cela n’est plus le cas aujourd’hui. En avril de l’année dernière, OpenAI a dévoilé l’option de désactivation de l’historique de chat dans ChatGPT après que des préoccupations soient apparues […]

ChatGPT veut se souvenir de tout ce que vous lui avez dit

ChatGPT veut se souvenir de tout ce que vous lui avez dit

OpenAI a annoncé lundi que son populaire chatbot ChatGPT pourra désormais se souvenir des détails des utilisateurs, y compris des informations de base, des hobbies et l’historique des interactions. La mémoire améliorée du chatbot sera disponible uniquement pour les abonnés au service ChatGPT Plus à 20 $ par mois. Une vidéo de démonstration fournie par […]

Chez Moderna, les GPTs d’OpenAI changent presque tout

Moderna devrait annoncer mercredi un partenariat avec le poids lourd de l’intelligence artificielle OpenAI, un accord visant à automatiser presque tous les processus commerciaux de l’entreprise de biotechnologie et à augmenter la portée du créateur de ChatGPT dans le domaine des entreprises. Dans le cadre de la transaction, environ 3 000 employés de Moderna auront […]

Le nouveau monde audacieux de ChatGPT

L’intelligence artificielle générative a été un sujet de discussion considérable – enthousiasme, appréhension, curiosité – depuis la mise à disposition gratuite au public de ChatGPT par OpenAI en novembre 2022. Ces outils vont-ils effectuer des tâches banales pour nous, améliorer notre productivité et notre créativité, ou un jour nous remplacer ? Les dirigeants de l’UofL […]