« Pour les écrivains, l’intelligence artificielle, c’est parfois plus d’éditeur de logicielles que d’idées. » Qui aurait cru que les pages de copyright se transformeraient en champ de bataille technologique ? Penguin Random House, le géant de l’édition, a décidé de faire front contre le raz-de-marée de l’intelligence artificielle. Les auteurs peuvent enfin souffler un peu plus sereinement, en étant protégés contre l’aspiration numérique de leurs œuvres par des IA affamées de données.
Le bruit court que Penguin Random House a modifié la page de copyright en début de ses ouvrages pour affirmer haut et fort : « Aucune partie de ce livre ne peut être utilisée ou reproduite de quelque manière que ce soit dans le but de former des technologies ou systèmes d’intelligence artificielle. » On dirait bien que l’éditeur a sorti le bouclier en titane pour protéger les mots des auteurs dépendants à chaque virgule, point et espace.
Mais ce n’est pas tout ! L’éditeur n’autorise pas non plus ses titres à être incorporés via des techniques de « text and data mining » (extraction de texte et de données) prévues par une récente directive du Parlement Européen. En somme, Penguin Random House joue les héros en défense des droits d’auteur, en plantant un panneau « Défense d’aspirer le contenu pour nourrir votre IA ».
Penguin Random House ne rigole pas avec les voleurs de données, même ceux sans mains ni pieds, mais juste quelques lignes de code.
Cependant, ils ne sont pas les seuls à monter au créneau : cette semaine, le New York Times a également montré les dents. Ils ont envoyé une lettre de mise en demeure à la startup IA Perplexity, leur ordonnant de ne plus utiliser leurs articles à des fins d’entraînement d’IA. Les articles, ou plutôt les œuvres d’art journalistiques, ne doivent pas se retrouver dans le mixeur technologique de l’IA de Perplexity, transformés en réponses toutes faites pour utilisateurs avides.
Face à cette levée de boucliers, on pourrait se demander si l’ère des intelligences artificielles chapardeuses de contenu doit repenser ses fautes ? Peut-être qu’au fond, elles ont juste besoin d’un petit cours de bonnes manières… ou d’un dictionnaire de synonymes bien fourni.
Ce conflit entre créativité et technologie continue de rappeler que chaque page tournée dans le monde numérique peut avoir des retombées inattendues. Entre fantaisie et réalité, il suffit d’appuyer sur « pause » pour recentrer le débat : « Ne prenons pas notre librairie pour une banque de données », en somme.
Source : Engadget