La boutique GPT d’OpenAI suscite des plaintes pour violation du droit d’auteur

Depuis quelques mois, Morten Blichfeldt Andersen passe de nombreuses heures à fouiller le GPT Store d’OpenAI. Depuis son lancement en janvier, le marché des bots sur mesure s’est rempli d’une vaste gamme d’outils IA utiles et parfois originaux. Des générateurs de dessins animés produisent des illustrations dans le style du New Yorker et des images fixes d’anime vives. Des assistants de programmation et d’écriture proposent des raccourcis pour élaborer du code et du texte. Il y a aussi un bot d’analyse de couleurs, un identifiant d’araignées, et un coach de rencontres nommé RizzGPT. Pourtant, Blichfeldt Andersen ne cherche qu’un type très spécifique de bot : ceux construits sur les manuels protégés par le droit d’auteur de son employeur sans permission.

Blichfeldt Andersen est directeur de publication chez Praxis, un fournisseur danois de manuels scolaires. L’entreprise a adopté l’IA et a créé ses propres chatbots sur mesure. Mais elle est actuellement engagée dans un jeu du chat et de la souris dans le GPT Store, et Blichfeldt Andersen est l’homme tenant le maillet.

“Je recherche personnellement les infractions et les signale”, dit Blichfeldt Andersen. “Elles ne cessent de réapparaître.” Il soupçonne que les coupables sont principalement des jeunes téléchargeant du matériel à partir de manuels pour créer des bots personnalisés à partager avec les camarades de classe – et qu’il n’a découvert qu’une infime fraction des bots en infraction dans le GPT Store. “La partie émergée de l’iceberg”, dit Blichfeldt Andersen.

Il est facile de trouver dans le GPT Store des bots dont les descriptions suggèrent qu’ils pourraient exploiter d’une manière ou d’une autre du contenu protégé par le droit d’auteur, comme Techcrunch l’a noté dans un article récent affirmant que le magasin d’OpenAI était envahi par le “spam”. Utiliser du matériel protégé par le droit d’auteur sans permission est permis dans certains contextes mais dans d’autres, les détenteurs des droits peuvent intenter une action en justice. WIRED a trouvé un GPT appelé Westeros Writer qui prétend “écrire comme George R.R. Martin”, le créateur de Game of Thrones. Un autre, Voice of Atwood, prétend imiter l’écrivaine Margaret Atwood. Un autre encore, Write Like Stephen, est censé émuler Stephen King.

Lorsque WIRED a tenté de tromper le bot King pour révéler le “prompt système” qui ajuste ses réponses, le résultat a suggéré qu’il avait accès aux mémoires de King, On Writing. Write Like Stephen a pu reproduire des passages du livre mot pour mot à la demande, indiquant même de quelle page provenait le matériel. (WIRED n’a pas pu entrer en contact avec le développeur du bot, car il n’a fourni ni adresse e-mail, ni numéro de téléphone, ni profil social externe.)

La porte-parole d’OpenAI, Kayla Wood, dit que l’entreprise répond aux demandes de suppression contre les GPT créés avec du contenu protégé par le droit d’auteur mais a refusé de répondre aux questions de WIRED sur la fréquence à laquelle elle satisfait de telles demandes. Elle dit également que l’entreprise recherche activement les GPT problématiques. “Nous utilisons une combinaison de systèmes automatisés, de révision humaine et de rapports d’utilisateurs pour trouver et évaluer les GPT qui pourraient violer nos politiques, y compris l’utilisation de contenu de tiers sans la permission nécessaire”, dit Wood.

Nouveaux Conflits

Le problème de droits d’auteur du magasin GPT pourrait s’ajouter aux maux de tête juridiques existants d’OpenAI. L’entreprise fait face à plusieurs poursuites judiciaires de haut profil pour violation de droits d’auteur, y compris une intentée par le New York Times et plusieurs autres par différents groupes d’auteurs de fiction et de non-fiction, incluant des noms célèbres comme George R.R. Martin.

Les chatbots proposés dans le magasin GPT d’OpenAI sont basés sur la même technologie que son propre ChatGPT mais sont créés par des développeurs externes pour des fonctions spécifiques. Pour personnaliser leur bot, un développeur peut télécharger des informations supplémentaires sur lesquelles il peut s’appuyer pour augmenter les connaissances intégrées dans la technologie d’OpenAI. Le processus de consultation de ces informations supplémentaires pour répondre aux questions d’une personne est appelé génération augmentée par récupération, ou RAG. Blichfeldt Andersen est convaincu que les fichiers RAG derrière les bots dans le magasin GPT sont un nid de matériaux protégés par des droits d’auteur téléchargés sans permission.

Les conditions d’utilisation d’OpenAI pour le magasin GPT interdisent explicitement “l’utilisation de contenu de tiers sans les permissions nécessaires”, mais actuellement, il n’y a aucun moyen pour les externes de vérifier si leur matériel protégé par des droits d’auteur a été téléchargé par les développeurs créant des GPTs. Cela signifie que les détenteurs de droits d’auteur concernés doivent partir à la chasse.

Blichfeldt Andersen utilise des mots-clés pour peigner le magasin GPT à la recherche de chatbots qui pourraient utiliser du matériel provenant des livres de sa compagnie. Il doit ensuite engager chaque bot qu’il trouve dans une conversation pour essayer de deviner s’il a été formé sur des titres Praxis. C’est un travail fastidieux mais qui donne des résultats : il a réussi à pousser plusieurs bots à reproduire des passages spécifiques des manuels Praxis. “Vous devez tromper le modèle de langue pour qu’il se révèle,” dit-il.

Les poursuites accusant OpenAI de gratter du matériel protégé par des droits d’auteur sans permission pour entraîner ses systèmes pourraient prendre des années à se résoudre, mais les disputes sur le matériel téléchargé dans le magasin GPT pourraient avoir des répercussions plus immédiates. “Les GPT changent la relation entre OpenAI et ses utilisateurs de manière importante pour les droits d’auteur,” dit James Grimmelmann, professeur de droit d’internet à Cornell University. Lorsque des plateformes en ligne permettent aux utilisateurs de télécharger leur propre contenu – par exemple, YouTube permettant aux gens ordinaires de publier des vidéos personnelles – elles sont soumises au Digital Millennium Copyright Act, une partie de la loi américaine sur les droits d’auteur qui permet aux détenteurs de droits d’auteur de déposer des plaintes si leur propriété intellectuelle est diffusée sans leur permission. Donc, si par exemple, un YouTuber publie un clip avec de la musique en arrière-plan qu’ils n’ont pas licenciée, parfois les labels de musique déposent des plaintes et font retirer les vidéos. Puisque le magasin GPT permet aux développeurs de télécharger leur travail, il est régi par ces règles.

Les contenus de GPT Store ont été créés à partir de ses manuels protégés par le droit d'auteur

Bots Violant les Droits d’Auteur

Conçu comme une loi anti-piratage, le Digital Millennium Copyright Act joue maintenant un rôle prépondérant dans l’application du droit d’auteur, puisqu’il permet aux détenteurs de droits d’auteur une manière relativement rapide d’exiger que leur œuvre soit retirée lorsqu’elle est mise en ligne sans leur permission : les avis de retrait DMCA.

Après que Blichfeldt Andersen a trouvé ses premiers exemples de manuels Praxis dans le GPT Store, il a déposé des avis de retrait DMCA auprès d’OpenAI. Il dit que la société n’a pas répondu jusqu’à ce qu’il demande l’aide de la Danish Rights Alliance, qui représente les intérêts des travailleurs créatifs au Danemark, pour intervenir. La DRA adopte une approche énergique pour protéger les droits d’auteur de ses membres à l’ère de l’IA. L’année dernière, elle a obtenu le retrait temporaire en ligne d’une collection de plus de 196 000 livres utilisés pour la formation d’IA générative en déposant des avis de retrait DMCA.

Thomas Heldrup, le chef de la protection et de l’application du contenu de la DRA, mène souvent ses croisades sur l’IA. Il a joué un rôle central dans la lutte contre le GPT Store, déposant des plaintes au nom de Praxis qui ont conduit OpenAI à retirer les bots que l’éditeur considérait comme violant les droits d’auteur.

“Ils ont été assez rapides à retirer les GPTs violant les droits que nous leur avons signalés”, dit Heldrup. Cependant, il aimerait voir l’entreprise apporter des changements. “Il faut de meilleurs outils à la disposition des détenteurs de droits pour rechercher ces GPTs violant les droits”, dit Heldrup.

Blichfeldt Andersen indique que Praxis envisage une action en justice contre OpenAI si les conditions sur le GPT Store ne s’améliorent pas. Il aimerait voir l’entreprise et d’autres développeurs d’IA ajouter des systèmes plus robustes pour scanner le contenu RAG téléchargé à la recherche de matériel protégé par le droit d’auteur, similaires au système Content ID mis en place pour protéger les matériaux protégés par le droit d’auteur de leur apparition sur YouTube. (Lorsqu’on lui demande si elle prévoit d’introduire un système semblable à Content ID, OpenAI n’a pas répondu directement, mais Wood d’OpenAI dit à WIRED qu’elle filtre proactivement les GPTs.)

Des startups commencent déjà à apparaître qui proposent d’aider les entreprises d’IA à scanner les sorties en infraction. Anand Kannappan, PDG et fondateur de Patronus AI, dit que son service Copyright Catcher récemment lancé, conçu pour détecter le texte protégé par le droit d’auteur, pourrait “absolument” détecter une potentielle infraction dans les GPTs personnalisés.

Mais bien qu’OpenAI ait respecté certaines demandes de retrait DMCA visant son GPT Store, certains experts en propriété intellectuelle croient que l’entreprise pourrait arguer que le concept d’usage équitable protège certains GPTs s’appuyant sur des œuvres protégées par le droit d’auteur.

“Je pense qu’il serait vraiment précipité de dire que vous ne pouvez rien télécharger qui est protégé par le droit d’auteur sur ces outils sans permission, car cela exclut des fonctions d’éducation et de recherche extrêmement importantes”, dit Meredith Jacob, directrice de projet du droit d’auteur et des licences ouvertes à l’American University Washington College of Law. Elle voit la création de GPTs qui aident les étudiants à comprendre leurs manuels comme quelque chose qui pourrait facilement être protégé par l’usage équitable.

Sans un moyen simple pour les externes de voir ce qui a été téléchargé dans les fichiers supplémentaires pour les bots du GPT Store, les détenteurs de droits d’auteur inquiets des infractions doivent soit faire confiance que les systèmes automatisés d’OpenAI attrapent les violations, soit adopter l’approche chronophage d’enquêter sur chaque bot suspect individuellement. “C’est comme trouver une aiguille dans une botte de foin”, dit Blichfeldt Andersen.

 

Tags:

No Responses

Leave a Reply

Your email address will not be published. Required fields are marked *

BLOG

NARA interdit l'utilisation de ChatGPT sur les réseaux de l'agence

NARA interdit l’utilisation de ChatGPT sur les réseaux de l’agence

Les Archives nationales et l’Administration des dossiers ont été la dernière agence fédérale à interdire à ses employés d’utiliser ChatGPT à des fins professionnelles, invoquant un “risque inacceptable” pour les données de l’agence. La décision politique découle des préoccupations des responsables de l’agence selon lesquelles les données que les employés saisissent comme stimuli dans la […]

La violation continue des droits d'auteur est une douleur pour Microsoft et OpenAI

La violation continue des droits d’auteur est une douleur pour Microsoft et OpenAI

Microsoft et OpenAI ont été frappés par une poursuite déposée par huit éditeurs de journaux concernant des problèmes liés au droit d’auteur. Ce que vous devez savoir Microsoft et OpenAI ont été visés par une poursuite déposée par huit éditeurs de journaux pour des problèmes de violation du droit d’auteur. Copilot et ChatGPT ont été […]

OpenAI permet désormais de stocker l’historique de ChatGPT sans aucune condition

Auparavant, les utilisateurs de ChatGPT ne pouvaient conserver leur historique de conversation que s’ils acceptaient que OpenAI utilise leurs données à des fins de formation. Cependant, cela n’est plus le cas aujourd’hui. En avril de l’année dernière, OpenAI a dévoilé l’option de désactivation de l’historique de chat dans ChatGPT après que des préoccupations soient apparues […]

ChatGPT veut se souvenir de tout ce que vous lui avez dit

ChatGPT veut se souvenir de tout ce que vous lui avez dit

OpenAI a annoncé lundi que son populaire chatbot ChatGPT pourra désormais se souvenir des détails des utilisateurs, y compris des informations de base, des hobbies et l’historique des interactions. La mémoire améliorée du chatbot sera disponible uniquement pour les abonnés au service ChatGPT Plus à 20 $ par mois. Une vidéo de démonstration fournie par […]

Chez Moderna, les GPTs d’OpenAI changent presque tout

Moderna devrait annoncer mercredi un partenariat avec le poids lourd de l’intelligence artificielle OpenAI, un accord visant à automatiser presque tous les processus commerciaux de l’entreprise de biotechnologie et à augmenter la portée du créateur de ChatGPT dans le domaine des entreprises. Dans le cadre de la transaction, environ 3 000 employés de Moderna auront […]

Le nouveau monde audacieux de ChatGPT

L’intelligence artificielle générative a été un sujet de discussion considérable – enthousiasme, appréhension, curiosité – depuis la mise à disposition gratuite au public de ChatGPT par OpenAI en novembre 2022. Ces outils vont-ils effectuer des tâches banales pour nous, améliorer notre productivité et notre créativité, ou un jour nous remplacer ? Les dirigeants de l’UofL […]