« Un visage peut en cacher un autre, surtout quand l’IA entre en scène ! » Alors que l’université de l’imaginaire poursuit ses travaux d’innovation, voilà que Microsoft Research Asia fait sortir du chapeau un outil d’IA, VASA-1, plus prestidigitateur que jamais. Imaginez : une simple image figée et un fichier audio suffisent à cette technologie pour animer ce visage avec un réalisme bluffant, le faisant parler et exprimer des émotions en temps réel. On se croirait presque dans un épisode de « Black Mirror », mais sans les côtés sombres… en théorie.
Certes, en y regardant de plus près, on pourrait trouver le mouvement des lèvres et de la tête un brin mécanique, presque sorti d’un vieux film de science-fiction, mais le potentiel est là, immense et, disons-le, un peu effrayant. Les chercheurs, conscients qu’ils tiennent entre leurs mains une boîte de Pandore potentielle pouvant servir à la création rapide de vidéos deepfake, ont mis un gros cadenas sur la boîte : pas de démo en ligne, pas d’API publique, rien jusqu’à ce qu’ils soient sûrs que leur création ne servira pas à inonder le monde de fausses nouvelles ou de fausses vidéos embarrassantes.
« Tout outil, aussi innovant soit-il, détient son propre côté obscur. »
Mais ne soyons pas trop pessimistes ! Les chercheurs voient dans VASA-1 un arc-en-ciel d’applications bénéfiques : un levier pour plus d’équité éducative, un outil pour briser les barrières de la communication, voire un compagnon pour ceux qui en auraient besoin. Imaginez, demain, parler à votre propre Mona Lisa animée, qui vous répondrait avec la voix douce d’Anne Hathaway chantant du Lil Wayne. Ah, l’art et la technologie en parfaite harmonie !
Ce petit miracle est possible grâce à l’entraînement de VASA-1 sur le VoxCeleb2 Dataset, un trésor de plus d’un million d’enregistrements de 6 112 célébrités extraites de YouTube. De là à avoir une conversation avec un Einstein numérique ou une Marilyn Monroe virtuelle, il n’y a qu’un pas. Le futur de la communication pointe le bout de son nez, et il a le visage de ceux que vous admirez… ou pas.
Source : Engadget