Meta Interrompt Ses Efforts Pour Licencier Des Livres Pour l’Entraînement de l’IA

Dans un rebondissement inattendu, de nouveaux documents juridiques dans une affaire de droits d’auteur opposant Meta à des auteurs et éditeurs apportent du crédit aux informations selon lesquelles la société aurait mis en « pause » ses discussions avec les éditeurs de livres concernant des accords de licence pour alimenter certains de ses modèles d’IA générative en données d’entraînement.

Une bataille juridique sur l’utilisation de contenus protégés

Ces documents sont liés à l’affaire Kadrey v. Meta Platforms, l’un des nombreux litiges dans le système judiciaire américain où s’affrontent les entreprises d’IA et les détenteurs de propriété intellectuelle. Dans la plupart des cas, les défendeurs – les entreprises d’IA – affirment que l’entraînement sur du contenu protégé par le droit d’auteur relève du « fair use ». Les plaignants – les détenteurs de droits – s’y opposent farouchement.

Des témoignages révélateurs de membres de Meta

Les nouveaux documents soumis au tribunal vendredi, qui incluent des transcriptions partielles de dépositions d’employés de Meta, suggèrent que certains d’entre eux estimaient que négocier des licences de données d’entraînement pour les livres pourrait ne pas être évolutif. Selon une transcription, Sy Choudhury, responsable des initiatives de partenariat IA de Meta, a déclaré que les démarches de Meta auprès de divers éditeurs ont été accueillies avec « une adoption et un intérêt très lents ».

« Je ne me souviens pas de la liste entière, mais je me souviens que nous avions fait une longue liste en parcourant initialement Internet pour trouver les principaux éditeurs, etc. », a déclaré Choudhury selon la transcription, « et nous n’avons pas eu de contact ni de retour de beaucoup de nos démarchages à froid pour tenter d’établir un contact. »

– Sy Choudhury, Responsable des initiatives de partenariat IA chez Meta

Des défis logistiques et juridiques

Selon les transcriptions, Meta a interrompu certains efforts de licence liés à l’IA début avril 2023 après avoir rencontré des obstacles de « timing » et autres contraintes logistiques. Choudhury a indiqué que certains éditeurs, en particulier d’ouvrages de fiction, se sont avérés ne pas détenir en réalité les droits sur le contenu que Meta envisageait de licencier.

  • Les éditeurs approchés n’avaient souvent pas les droits pour licencier le contenu
  • Obtenir les droits auprès de chaque auteur prendrait beaucoup de temps
  • Meta a déjà mis en pause d’autres initiatives de licence par le passé

Des accusations de piratage et d’utilisation de « bibliothèques de l’ombre »

Depuis le dépôt initial de la plainte en 2023, les avocats des plaignants l’ont amendée plusieurs fois. La dernière version accuse Meta, entre autres, d’avoir croisé certains livres piratés avec des ouvrages sous droits d’auteur disponibles sous licence pour déterminer s’il était pertinent de chercher un accord de licence avec un éditeur. Elle accuse aussi l’entreprise d’avoir utilisé des « bibliothèques de l’ombre » contenant des e-books piratés pour entraîner plusieurs de ses modèles d’IA, dont sa populaire série de modèles « ouverts » Llama. Selon la plainte, Meta aurait pu se procurer certaines de ces bibliothèques via le torrenting, une forme de partage de fichiers que les plaignants assimilent à de la contrefaçon.

Des implications majeures pour l’avenir de l’IA

Cette affaire, et les nombreuses autres similaires, pourraient avoir un impact profond sur le développement futur des systèmes d’IA. Si les tribunaux décident que l’entraînement sur du contenu protégé par le droit d’auteur sans licence ne relève pas du « fair use », cela pourrait fortement limiter la capacité des entreprises à créer des modèles d’IA à grande échelle. Inversement, une décision en faveur des entreprises d’IA pourrait affaiblir le contrôle des créateurs et éditeurs sur l’utilisation de leurs œuvres. Quoi qu’il arrive, le résultat de ces litiges façonnera sans aucun doute le paysage de l’IA pour les années à venir.

À lire également