À quel point le paysage de l’IA générative s’apprête-t-il à être bouleversé avec l’arrivée des technologies vocales de Google ? Alors que l’on s’est jusqu’ici concentré sur des interfaces basées sur le texte pour générer du contenu écrit ou visuel, une nouvelle vague semble émerger : celle de la voix. Google a récemment annoncé l’intégration de Chirp 3, son interface vocale haute définition, à la plateforme de développement Vertex AI dès la semaine prochaine. Quel rôle jouera cette avancée dans l’élaboration des technologies vocales modernes ?
Google avait discrètement annoncé le lancement de Chirp 3 et ses huit nouvelles voix couvrant 31 langues. À quoi servira concrètement cette nouvelle fonctionnalité ? Elle pourrait bien être clé pour développer des assistants vocaux, des livres audio, des agents de support, ou encore des voix-off pour vidéos. Cette nouvelle a été dévoilée lors d’un événement à Londres, dans les locaux de DeepMind. Mais Google n’est pas seul dans cette course : d’autres acteurs n’hésitent pas à avancer à grands pas avec leurs propres technologies vocales, comme l’illustre la startup Sesame et ses applications virales.
Est-ce que ces nouvelles voix capturent vraiment l’essence de ce qu’on considère comme « réaliste »? Thomas Kurian, CEO de Google Cloud, a souligné que des restrictions d’usage seront en place pour prévenir les dérives potentielles. Tandis que ElevenLabs lève des fonds pour étendre ses propres services de voix IA, on peut se demander comment le marché s’ajustera à l’arrivée de Chirp 3 aux côtés des autres modèles d’IA de Google tels que Gemini ou Imagen.
Dans un monde en constante évolution, parviendrons-nous à faire de la voix IA une prouesse aussi crédible et fiable que celle des textes générés par nos machines ?
Alors que la marge entre réalisme et artifice se rétrécit, Demis Hassabis, CEO de DeepMind, nous rappelle que le chemin vers une intelligence similaire à celle des humains est encore long et semé d’embûches. L’arrivée de Chirp 3 sur Vertex AI nous propulse à un moment charnière où la technologie pourrait redéfinir la décennie à venir. Depuis son lancement en 2021, Vertex AI, plateforme phare de Google pour le développement de services de machine learning sur le cloud, a vu sa popularité croître parallèlement à l’engouement pour l’IA générative.
Comment Google compte-t-il amplifier son offre face à des titans comme Microsoft et Amazon ? Avec Chirp 3, Google continue de peaufiner ses technologies IA, s’assurant de rester dans la course au génie artificiel tout en garantissant la sécurité de ses utilisateurs. L’innovation chez Google n’est pas un sprint, mais bien un marathon. Le concept de « Chirp » chez Google, autrefois un nom de code pour rivaliser avec Alexa, évolue et prend désormais une dimension stratégique majeure.
Face à ces développements, une question se pose : jusqu’où les technologies vocales peuvent-elles nous emmener, et serons-nous prêts pour ce qu’elles promettent ?
Source : Techcrunch