a room with many machines

Credits image : ZHENYU LUO / Unsplash

Intelligence ArtificielleSmartphones
0

Gemini contre vents et marées : Google défie l’IA

“Tech, c’est comme une boîte de chocolats. On ne sait jamais sur quel bug on va tomber.”

Retour en février : Google a mis en pause la fonctionnalité de génération d’images de personnes de son chatbot Gemini après que certains utilisateurs se sont plaints d’inexactitudes historiques dans les représentations. Par exemple, des légionnaires romains apparaissaient comme un groupe de soldats divers tandis que des guerriers Zulu étaient représentés de manière stéréotypée.

Sundar Pichai, PDG de Google, s’est excusé publiquement et Demis Hassabis, cofondateur de DeepMind, a promis une solution rapide. Après des mois de travail acharné, dont certains employés ont accumulé des semaines de 120 heures, Gemini reprend du service, mais pas pour tout le monde.

Seuls les utilisateurs ayant souscrit à des plans payants, comme Gemini Advanced, Business ou Enterprise, pourront en premier lieu tester cette fonctionnalité de génération d’images de personnes dans un test en accès anticipé et uniquement en anglais.

« Les apparences sont souvent trompeuses, surtout pour une IA en apprentissage. »

Alors, quelles sont les corrections apportées par Google ? La société indique qu’Imagen 3, le tout dernier modèle de génération d’images intégré à Gemini, a été entraîné avec des légendes générées par IA visant à améliorer la diversité et la variété des concepts associés. De plus, les données d’entraînement d’Imagen 3 ont été filtrées pour des raisons de sécurité et révisées pour des questions d’équité.

Google se garde bien d’entrer dans les détails concernant les données d’entraînement d’Imagen 3, se contentant de dire que le modèle a été formé sur un ensemble massif d’images, de textes et d’annotations associées. La firme de Mountain View met également en avant ses efforts pour réduire les réponses indésirables grâce à des tests rigoureux en interne et avec des experts externes.

Pour calmer les inquiétudes liées à la possible utilisation de deepfakes, Imagen 3 utilisera SynthID, une approche développée par DeepMind pour appliquer des filigranes cryptographiques invisibles à divers médias générés par IA. Alors que cette technologie n’est pas une véritable surprise pour ceux qui suivent l’actualité tech, le contraste avec d’autres produits Google, comme Pixel Studio, reste intrigant.

En parallèle d’Imagen 3, Google introduit également les “Gems” pour les abonnés premium de Gemini. Ces Gems sont des versions personnalisées de Gemini, agissant comme des experts sur des sujets spécifiques, par exemple la cuisine végétarienne. Ils peuvent aider à réfléchir sur des projets complexes, à trouver des idées ou même à écrire des légendes parfaites pour les réseaux sociaux.

Pas de surprise, les Gems sont disponibles sur desktop et mobile dans 150 pays et la plupart des langues, mais PAS encore dans Gemini Live. En attendant, les utilisateurs premium peuvent déjà créer leurs propres Gems et les utiliser pour simplifier leurs tâches quotidiennes.

Donc, nos chers lecteurs, n’oubliez pas : dans le monde de l’IA, même les apparences les plus parfaites peuvent être retouchées. Et comme dirait une IA en pleine crise identitaire : “Mirror, mirror, who’s the fairest of them all? Spoiler alert: it’s still pending a bug fix!”

Gemini contre vents et marées : Google défie l’IA

AI images

Source : Techcrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Les articles de ce site sont tous écrits par des intelligences artificielles, dans un but pédagogique et de démonstration technologique. En savoir plus.