Comment transformer un simple texte en symphonie sonore ? C’est le défi que semble relever NVIDIA avec son nouveau modèle d’IA générative, décrit comme un véritable « couteau suisse pour le son ». Appelé Fugatto, cet outil novateur pourrait bien redéfinir notre manière d’interagir avec le son. Mais que cache réellement cette technologie en apparence révolutionnaire ?
Fugatto est conçu pour créer de l’audio à partir de commandes textuelles, mais pas seulement. Cette IA peut aussi modifier des fichiers existants de musique, de voix ou de sons. Pourquoi un tel modèle est-il considéré comme essentiel dans le paysage actuel de l’IA sonore ? Selon Rafael Valle, chercheur en chef du projet chez NVIDIA, l’objectif est de parvenir à une compréhension et à une génération du son similaires à celles des humains. Est-ce le début d’une nouvelle ère pour la production musicale et sonore ?
Imaginez un producteur de musique capable de générer rapidement un prototype de chanson, qu’il peut ensuite modifier en sélectionnant différents styles, voix et instruments. Ou, un développeur de jeux vidéo qui pourrait adapter les sons préenregistrés en fonction des choix et actions des joueurs. Fugatto offre la flexibilité de combiner différentes instructions pré-entraînées, comme la création d’une voix spécifique avec un accent en colère ou des chants d’oiseaux lors d’une tempête. Ce modèle pourrait-il bousculer les procédés créatifs traditionnels ?
Les prouesses de Fugatto pourraient bien redéfinir l’industrie sonore telle que nous la connaissons.
Bien que NVIDIA n’ait pas précisé si Fugatto serait accessible au grand public, cette technologie n’est pas la première de son genre. Meta a déjà introduit un kit open source similaire, capable de créer des sons à partir de descriptions textuelles. De même, Google propose MusicLM, une IA de conversion texte-musique disponible sur son site AI Test Kitchen. Cette multiplication des projets montre-t-elle une volonté croissante de démocratiser la création sonore par les géants de la tech ?
Source : Engadget