« Données, données, où est-ce que vous en mettez ? », aurait dit un youtuber célèbre si on lui avait volé ses sous-titres. Et bien c’est justement la question qui agite le monde technologique aujourd’hui. Selon une nouvelle enquête par Proof News, les géants Apple, NVIDIA et Anthropic ont formé leurs IA avec des transcriptions de plus de 173 000 vidéos YouTube… sans demander ni permission ni compensation.
Le scoop de ce data-siphonage a été découvert grâce à une base de données créée par EleutherAI. Pas de vidéos ou images, mais juste les transcriptions de vidéos YouTube de grands noms comme Marques Brownlee et MrBeast, ainsi que des médias réputés tels que The New York Times et la BBC. Même les vidéos d’Engadget ne sont pas épargnées.
Marques Brownlee, bien connu sous le pseudo MKBHD, n’est pas resté silencieux. Sur X, il se plaint : « One of them scraped tons of data/transcripts from YouTube videos, including mine », rappelant que Apple ne pouvait pas être directement tenu responsable car ils n’ont pas eux-mêmes récolté ces données. Mais sérieux, la situation semble floue.
L’IA avance sur un terrain miné et les créateurs ne sont même pas au courant.
Google, de son côté, soutient que toute collecte sans permission de vidéos YouTube viole les règles de la plateforme. Pour l’instant, Apple, NVIDIA, Anthropic et EleutherAI gardent un silence de plomb, malgré les questions insistantes d’Engadget.
La transparence sur les sources de données reste une zone d’ombre pour les entreprises d’IA. Il y a quelques semaines, Apple était déjà sous le feu des critiques pour n’avoir pas révélé l’origine des données formant son modèle de génération d’images. Un argument en or pour toutes les discussions autour de l’éthique des IA.
En tout cas, il semble qu’OpenAI n’est pas sortie de l’auberge non plus. Quand on a demandé à leur CTO, Mira Murati, s’ils utilisaient des vidéos YouTube pour entraîner leur outil Sora, elle a préféré noyer le poisson. En résumé, c’est un peu la partie de cache-cache du siècle, et les règles du jeu restent floues. Vous voulez vérifier si vos sous-titres favoris sont dans le lot ? Utilisez l’outil de recherche de Proof News.
À suivre, car comme on dit, si une IA regarde vos vidéos, mieux vaut qu’elle ne se fasse pas pincer !
Source : Engadget