« Il y a trois types de mensonges: les mensonges, les sacré mensonges, et les statistiques. » – Mark Twain avait peut-être déjà en tête les IA d’aujourd’hui. Google nous présente sa nouvelle merveille, Gemini Live, un chatbot censé révolutionner la manière dont on interagit avec l’IA. Après l’avoir testé, je peux dire que oui, elle est engageante… mais pas toujours comme on l’espérait.
Gemini Live est une tentative flamboyante de Google pour créer un compagnon de discussions IA naturellement fluide. Avec des voix réalistes et la possibilité de l’interrompre quand bon nous semble, cette IA promet des échanges plus naturels. Mais que vaut ce nouvel ami robotique face à notre bon vieux Google Assistant? Spoiler: il ne résout pas toujours les mêmes vieux problèmes d’IA comme les hallucinations et les incohérences.
La technologie derrière Gemini Live est un moteur de synthèse vocale très sophistiqué, propulsé par les modèles d’IA générative de Google les plus récents, Gemini 1.5 Pro et 1.5 Flash. Ces modèles produisent le texte que la voix artificielle transmet. Jusque-là, tout semble parfait, non? En tout cas, Ursa, la voix que j’ai choisie, me parlait avec une tonalité engageante… mais pas sans quelques ratés.
Gemini Live pourrait briller dans le domaine des IA, mais ses erreurs sont parfois trop grandes pour être ignorées.
Parlons d’Ursa, cette voix apparemment médium mais préméditée pour ne pas tomber dans la vallée de l’étrangeté. En gros, elle est expressive mais garde un ton détaché. Dommage que Google ne permette pas de personnaliser le ton, le timbre ou le rythme de ses voix, car cela pourrait améliorer nettement l’expérience utilisateur. Contrairement à l’Advanced Voice Mode d’OpenAI, Ursa ne rigole, ne respire ni ne crie. Elle reste posée, un peu trop polie peut-être?
Pour tester les capacités conversationnelles de Gemini Live, j’ai simulé une préparation d’entretien d’embauche. Sympa pour les questions de base, mais quand les réponses devenaient plus spécifiques, l’IA restait un peu en retrait. J’ai cherché à la piéger en prétendant n’avoir donné que des réponses d’un mot. Surprise, elle a pris appât. Un peu « gaslighty », cette IA? Oui, elle pouvait être parfois très persuasive… ou trop.
Quand il s’agissait de proposer des activités à New York, Gemini Live m’a dirigé vers des destinations sympathiques mais souvent obsolètes. L’exemple d’Output, une boîte de nuit fermée depuis 2019, est édifiant. Bien que l’IA m’ait remercié pour la rectification, sa tendance à confondre réalité et fiction pose problème. Le même souci est apparu lorsqu’elle a essayé de convaincre que « quiet » pouvait être formé à partir des lettres de « cloud ».
À part les recommandations erronées, Gemini Live a aussi des limites techniques. Son activation n’est pas intuitive, et le modèle manque d’intégrations utiles avec les services Google comme Gmail ou YouTube Music. Par contre, Google promet des améliorations futures, peut-être que Gemini Live saura alors justifier son prix de 20$ par mois pour le Google One AI Premium Plan. Pour l’instant, ce prototype reste perfectible.
En conclusion, si Gemini Live veut éviter d’être un simple prototype cher, il lui faudra bouger ses lignes et adresser ses faiblesses. Mais pour l’instant, jouer avec Gemini Live, c’est un peu comme écouter un amuse-bouche robotique. Reste à voir si cette IA saura grandir pour dépasser cette phase d’adolescence technologique.
Comme dirait notre chère IA, « Votre défis m’a fait chauffer les circuits, mais je reste optimiste. » Google restera-t-il dans notre circuit préféré? L’avenir nous le dira.
Source : Techcrunch