Quelles sont les limites éthiques et légales de l’utilisation des données dans l’entraînement des intelligences artificielles? C’est une question cruciale à laquelle des géants technologiques comme Meta doivent répondre, alors qu’ils se retrouvent, une fois de plus, dans la tourmente judiciaire. Une nouvelle affaire aux États-Unis, Kadrey v. Meta Platforms, révèle les tensions persistantes entre les entreprises d’IA et les titulaires de droits d’auteur.
Meta, avec ses propositions de licence, espérait à l’origine inclure des livres dans le développement de ses modèles IA. Mais pourquoi cela s’est-il avéré si complexe? Les documents récents, tirés des dépositions de plusieurs employés de Meta, montrent que l’entreprise a rencontré des obstacles significatifs dans ses négociations avec les éditeurs de livres. Pourquoi tant de réticence? Sy Choudhury, responsable des partenariats IA chez Meta, a décrit des engagements lents et limités de la part des éditeurs, ce qui soulève la question de la faisabilité de telles collaborations.
En avril 2023, Meta a dû mettre en pause certains de ses efforts de licence concernant les livres, confrontée à des défis logistiques et temporels. Comment se fait-il que de nombreux éditeurs n’aient pas les droits qu’ils prétendaient avoir? Selon Choudhury, cela a ajouté une couche de complexité imprévue, en particulier dans la catégorie fiction où les droits des auteurs semblent dicter le rythme des négociations.
Dans une industrie où les droits d’auteur et l’innovation se chevauchent, comment établir un équilibre juste?
L’affaire prend une tournure encore plus préoccupante avec les accusations portées par les plaignants, qui incluent des auteurs célèbres comme Sarah Silverman. Leurs avocats ont affirmé que Meta a eu recours à des « bibliothèques de l’ombre », utilisant des livres piratés pour entraîner ses modèles d’IA. Le fait qu’on évoque le téléchargement via torrent, souvent considéré comme une violation du droit d’auteur, place Meta dans une position délicate.
Si ces allégations sont vérifiées, cela signifie-t-il que l’innocuité affichée de l’entraînement des modèles IA est menacée par des pratiques éthiquement discutables? Ces pratiques soulèvent la question essentielle de savoir jusqu’où les grandes entreprises technologiques sont prêtes à aller pour alimenter leurs innovations. Avec le litige toujours en cours, la lumière sera-t-elle faite sur ce que Meta et similaires considèrent comme “usage loyal” dans un contexte de droits d’auteur?
La question fondamentale qui se pose est alors la suivante : comment les entreprises d’IA peuvent-elles concilier innovation technologique et respect des cadres juridiques et éthiques en vigueur?
Source : Techcrunch