Anthropic accepte de payer aux auteurs plus de 1,5 milliard de dollars pour avoir utilisé leur travail pour former l’IA, totalisant environ 3 000 $ par livre
Anthropic a accepté de payer plus de 1,5 milliard de dollars pour régler un recours collectif intenté par des auteurs qui allèguent que la société a illégalement utilisé ses livres pour former ses modèles d’intelligence artificielle, selon un dossier judiciaire de vendredi.
Le règlement proposé de recours à la classe, s’il était approuvé par un juge fédéral, serait « le plus grand recouvrement du droit d’auteur publié publiquement de l’histoire », selon les avocats d’Anthropic et des auteurs.
Il établit également une nouvelle norme pour les sociétés d’IA en compensant les artistes, les auteurs et autres titulaires de droits d’auteur pour former des modèles de gros langues sur leur travail, selon Justin Nelson, un avocat de Susman Godfrey représentant les artistes.
« Cette colonie historique dépasse de loin toute autre reprise connue du droit d’auteur », a déclaré Nelson à Trading Insider. « C’est le premier du genre à l’ère de l’IA. Il fournira une rémunération significative pour chaque travail de classe et établira un précédent obligeant les entreprises à payer les propriétaires de droits d’auteur. »
Selon les termes du règlement proposé, les auteurs recevraient environ 3 000 $ pour chaque livre piraté utilisé pour former des modèles de langues d’Anthropic, qui alimentent son chatbot populaire, Claude.
L’argent irait aux auteurs dont les livres étaient inclus dans Pirate Mirror Library and Library Genesis, deux bases de données de livres piratés Anthropic utilisés pour la formation.
Les avocats d’Anthropic et les auteurs pensent que 500 000 livres sont dans la base de données, mais Anthropic a déclaré plus d’argent si plus de livres étaient trouvés.
Selon les conditions du règlement, Anthropic pourrait toujours être tenu responsable s’il utilise des livres piratés à l’avenir. La société d’IA est également tenue de détruire ses copies de la bibliothèque Pirate Mirror et des ensembles de données Genesis de la bibliothèque après avoir terminé l’identification et le paiement des auteurs.
L’accord de règlement n’entre en vigueur que s’il est approuvé par le juge de district américain William Alsup, qui supervise l’affaire. Alsup a prévu une audience pour lundi après-midi dans sa salle d’audience de San Francisco pour discuter de si les conditions sont justes.
Le règlement ne change pas la décision antérieure d’Alsup que l’utilisation par Anthropic des livres pour former ses modèles était une « utilisation équitable » en vertu de la loi sur le droit d’auteur.
« En juin, le tribunal de district a rendu une décision historique sur le développement de l’IA et la loi sur le droit d’auteur, constatant que l’approche d’Anthropic pour la formation des modèles d’IA constitue une utilisation équitable », a déclaré vendredi Aparna Sridhar, adoptive adjointe d’Anthropic, dans un communiqué. « Le règlement d’aujourd’hui, s’il est approuvé, résoudra les réclamations héritées restantes des demandeurs. »
La décision du jugement sommaire d’Alsup a révélé qu’Anthropic avait utilisé plus de 7 millions de livres piratés pour former ses modèles de langues importants, et a physiquement coupé et scanné des millions d’autres.
Mais selon les conditions de règlement de vendredi, les avocats des auteurs ont trouvé des doublons dans la base de données de formation d’Anthropic et, après avoir fait correspondre les livres avec les inscriptions du bureau du droit d’auteur, a réduit la liste des livres volés à 465 000.
S’il est approuvé, le règlement marquerait la fin de l’une des poursuites en droit d’auteur les plus en vue et les plus sophistiquées contre les sociétés de renseignement artificiel.
Cela signifierait également que l’affaire ne fera pas son chemin devant la Cour suprême, ce qui aurait pu profiter de l’occasion pour résoudre les questions persistantes sur la loi sur le droit d’auteur lié à la formation modèle et à l’IA génératrice.
Selon les conditions de règlement proposées de vendredi, les avocats représentant l’auteur demandent à Alsup d’approuver 25% du fonds de règlement de plus de 1,5 milliard de dollars pour aller à leurs frais juridiques.

