Comment se fait-il que des géants technologiques comme OpenAI et Google puissent utiliser potentiellement des vidéos YouTube sans respecter le droit d’auteur, selon un rapport du New York Times? Cette enquête révèle que des sociétés telles qu’OpenAI, Google, et Meta aspireraient à maximiser le volume des données alimentant leurs IA. Mais que savons-nous vraiment sur les pratiques de ces entreprises?
OpenAI, selon le NYT, aurait utilisé son outil de reconnaissance vocale Whisper pour transcrire plus d’un million d’heures de vidéos YouTube, entraînant ainsi GPT-4. Google, de son côté, affirme ne pas autoriser la récupération non autorisée de contenu YouTube. The Information avait déjà rapporté l’utilisation de vidéos et de podcasts YouTube par OpenAI pour la formation de deux systèmes d’IA. L’ironie ne réside-t-elle pas dans le fait que Google lui-même utiliserait ces pratiques tout en les interdisant?
Le rapport du NYT spécifie que Google était au courant mais n’a pas agi contre OpenAI, car l’entreprise utilisait également des vidéos YouTube pour former ses propres modèles d’IA. Est-ce l’aveu d’une double mesure?
Quelles sont les réelles implications de ces pratiques pour les créateurs de contenu et l’intégrité du droit d’auteur?
Google prétend collaborer uniquement avec des créateurs ayant consenti à participer à un programme expérimental. Mais alors, comment définir la frontière entre l’utilisation légitime et l’exploitation abusive du contenu disponible publiquement?
Des modifications ont été apportées en juin 2022 à la politique de confidentialité de Google, couvrant de manière plus générale l’utilisation de contenus publics, y compris Google Docs et Google Sheets, pour entraîner ses modèles et produits d’IA. Est-ce suffisant pour garantir le consentement éclairé des utilisateurs et le respect de leurs droits?
La situation soulève de nombreuses questions concernant l’éthique, le droit d’auteur et le respect du consentement des créateurs. Quelles mesures les entreprises doivent-elles prendre pour assurer une utilisation éthique et légale des données? Et surtout, comment les créateurs peuvent-ils protéger leur contenu dans cet écosystème numérique en constante évolution?
Source : Engadget