« Il parait que les IA sont des petits génies… jusqu’à ce qu’on leur demande d’épeler. » C’est assez ironique de constater que nos chers amis les robots, capables de battre les grands maîtres aux échecs ou de déboguer du code à la vitesse de la lumière, s’avèrent être de piètres concurrents face à des collégiens lors d’un concours d’orthographe. Il semblerait qu’ils se prennent les pieds dans le tapis dès qu’il s’agit d’épeler correctement « taco ».
Prenons l’exemple de nos chers générateurs d’images comme DALL-E, capables de vous concocter un menu pour un restaurant mexicain où l’on pourrait déguster des « taao », « burto » et autres « enchida ». Un délice pour les yeux, mais un cauchemar pour les puristes de la langue ! Et que dire de ChatGPT, qui, malgré sa capacité à vous rédiger une dissertation en un claquement de doigts, va suggérer « balaclava » comme mot de dix lettres sans la lettre « A » ou « E ».
« Le génie de l’IA s’arrête où commence l’orthographe. »
Que ce soit dans le domaine de la génération d’images ou de texte, les IA éprouvent des difficultés similaires face aux détails, tel que l’orthographe. Pour les images, le problème vient des modèles de diffusion, qui reconstruisent une image à partir de bruit. Quant aux modèles de langage, leur capacité à continuer une séquence ne tient qu’à une complexe gymnastique mathématique, bien loin d’une véritable compréhension du texte.
Les algorithmes s’attachent davantage à recréer quelque chose de visuellement proche de ce qu’ils ont mémorisé, sans pour autant intégrer les règles élémentaires que nous, humains, tenons pour acquises. Résultat : ils sont capables de vous dessiner une main avec six doigts, mais pas d’écrire correctement « hello ». Les chercheurs tentent de combler ces lacunes, notamment en entraînant les IA sur des modèles spécifiques, mais l’anglais, avec ses irrégularités, reste un casse-tête de taille.
Certaines approches, comme celle d’Adobe Firefly, choisissent alors de ne pas générer de texte du tout. Mais si votre description est suffisamment détaillée, cette barrière peut être facilement contournée. Tout cela pour dire que la route est encore longue et que, même si les modèles d’IA s’améliorent à une vitesse ahurissante, il reste encore un grand nombre de détails qui leur échappent.
En fin de compte, ces faiblesses dans la génération de texte et d’images par l’IA peuvent se révéler utiles pour détecter des contenus synthétiques, comme des panneaux de signalisation erronés ou des textes absurdes. Et, comme le souligne Matthew Guzdial, si l’on regarde de plus près, ce ne sont pas seulement les doigts et l’orthographe que les IA peinent à reproduire correctement. On pourrait presque dire que nous sommes encore loin du moment où les IA pourront nous donner des leçons d’orthographe !
Source : Techcrunch