Peut-on vraiment faire confiance à l’IA pour les tâches de base comme l’orthographe et le comptage? Que sait-on réellement de la méthode de fonctionnement des modèles de langage? Les récentes révélations sur les faiblesses des générateurs de texte IA tels que ChatGPT ont suscité des interrogations cruciales.
En naviguant sur les réseaux sociaux, vous êtes-vous déjà demandé pourquoi des posts mettent en évidence l’incapacité des IA à compter le nombre de lettres dans un mot aussi simple que « strawberry »? Comment ces technologies avancées peuvent-elles échouer à une tâche aussi rudimentaire? Cela alimente un débat sur les limites cognitives des IA, qui ne pensent pas comme nous.
Les modèles de diffusion et les grands modèles de langage (LLM) comme Claude et ChatGPT font constamment des erreurs lorsqu’il s’agit de problèmes d’orthographe ou d’anagrammes. Savez-vous pourquoi? La raison est intrigante: ces systèmes ne traitent pas les informations en se basant sur les lettres constituant un mot. En fait, il se pourrait même qu’ils ne comprennent pas ce que sont des lettres.
Cela nous amène à nous questionner sur la réelle compréhension et perception des informations textuelles par l’IA.
Alors, pourquoi les IA échouent-elles en orthographe? Le TechCrunch Minute d’aujourd’hui nous explique les limites fondamentales des modèles génétiques. Malgré leur capacité à générer du texte cohérent et pertinent, ils montrent systématiquement des lacunes dans des tâches qui nous semblent élémentaires.
Mais où cela nous conduit-il? Serait-ce une preuve que les IA, même les plus sophistiquées, ne sont pas encore à la hauteur de l’intelligence humaine pour des aspects aussi simples que l’orthographe? Quels mécanismes manquerait-il pour que ces IA comprennent vraiment le langage écrit tel qu’un humain le fait?
Avec une fascination croissante pour l’intelligence artificielle, il est essentiel de démystifier ces technologies et leur fonctionnement. Quel est l’avenir des LLMs face à ces défis persistants? Ferons-nous confiance à ces outils pour des tâches plus complexes si elles échouent aux plus basiques?
Source : Techcrunch