« L’IA, c’est comme une cocotte-minute : faut gérer la pression sinon ça explose. »
OpenAI a récemment lancé ses nouveaux modèles o1, surnommés « Strawberry », créant une grande excitation parmi les utilisateurs de ChatGPT impatients d’essayer cette IA qui prend le temps de « réfléchir » avant de répondre. Mais la fraise est-elle vraiment mûre à point ?
Ahem, pas tout à fait. Comparés au précédent modèle GPT-4o, les modèles o1 semblent avancer d’un pas tandis qu’ils reculent de deux. Bien que ChatGPT o1 soit meilleur pour raisonner et répondre à des questions complexes, son utilisation coûte environ quatre fois plus cher que GPT-4o. Et surprise, ce nouveau modèle manque des outils, des capacités multimodales et de la vitesse impressionnante de son prédécesseur. Même OpenAI admet que « GPT-4o reste la meilleure option pour la plupart des requêtes » et que GPT o1 peine sur des tâches plus simples.
Selon Ravid Shwartz Ziv, professeur à l’Université de New York : « C’est impressionnant, mais l’amélioration n’est pas si significative. » En gros, c’est mieux pour certains problèmes mais pas tout le temps.
GPT o1 est conçu pour les grandes questions, pas pour vos triviales interrogations sur la capitale du Nevada.
ChatGPT o1 se distingue par sa capacité unique à « réfléchir » avant de répondre, décomposant les grands problèmes en petites étapes. Cette « raisonnement par étapes » n’est pas totalement nouvelle, mais elle devient enfin pratique grâce à la puissance accrue des modèles actuels. Pourtant, il faut garder à l’esprit que cette réflexion prend du temps et, surtout, des « jetons de raisonnement » toujours plus nombreux, ce qui alourdit vite la facture.
Demander à ChatGPT o1 de planifier un Thanksgiving pour 11 personnes, par exemple, vous donne une réponse détaillée en 750+ mots après 12 secondes de réflexion sophistiquée. Cependant, lui demander où trouver un cèdre en Amérique vous vaut un essai de 800+ mots détaillant tous les cèdres existants. Bref, parfois, ChatGPT o1 ne sait tout simplement pas quand s’arrêter.
Toute cette hype autour de Strawberry a pourtant vu le jour avant même son lancement, alimentée par une industrie de l’IA en quête de sens suite au départ mouvementé de Sam Altman d’OpenAI. Sam lui-même a clarifié que o1 « n’est pas de l’AGI », refroidissant rapidement les attentes exagérées.
Mais où est la véritable valeur ajoutée dans tout cela ? Certains estiment que ChatGPT o1 peut être utile pour une niche de problèmes complexes là où GPT-4 échoue. D’autres, comme Andy Harrison, voient un décalage théorique sur la façon dont l’IA devrait fonctionner, entre automatisation des processus et intelligence généralisée. La question demeure : la fraise d’OpenAI vaut-elle le coût exorbitant ?
Ne vous laissez pas berner par une IA qui réfléchit trop, parfois, une fraise pas mûre peut gâcher le gâteau!
ChatGPT o1 : Nettoyage par la Fraise
Overthinking AI
Source : Techcrunch