À quoi ressemblera l’avenir des modèles d’intelligence artificielle en matière de raisonnement ? C’est une question qui prend de plus en plus de place dans le monde technologique ces jours-ci. L’AI continue de bousculer les frontières, mais à un moment où les anciens concepts de mise à l’échelle semblent s’essouffler, de nouvelles approches offrent des pistes intrigantes.
Récemment, DeepSeek, un laboratoire chinois d’IA financé par des traders quantitatifs, a dévoilé DeepSeek-R1. Ce modèle serait capable de concurrencer le modèle o1 de OpenAI. Quelle nouveauté apporte-t-il dans la sphère des IA de raisonnement ? Contrairement à des modèles standards, ces IA passent plus de temps à analyser une question avant de fournir une réponse. Peut-être est-ce là l’avenir de l’IA ?
Le modèle DeepSeek-R1 a été mis à l’épreuve sur deux benchmarks populaires : AIME et MATH. Tandis qu’il performe sur ces tests, ses faiblesses sur des problèmes de logique simples ou les défis de sécurité, telles que les tentatives de *jailbreaking* réussies, posent question. Est-ce que cette vulnérabilité met en lumière une faiblesse fondamentale ?
La capacité des modèles d’IA à raisonner remet-elle en question les lois traditionnelles de la mise à l’échelle ?
Mais il ne s’agit pas uniquement de performances techniques. DeepSeek-R1 bloque certaines requêtes jugées politiquement sensibles, apparemment sous la pression du gouvernement chinois. Jusqu’où les contraintes politiques influenceront-elles l’évolution de l’IA ? Le gouvernement chinois est en train de renforcer son contrôle, influençant les sources d’entraînement des modèles avec des lois restrictives. Quel impact ce contrôle aura-t-il sur l’innovation technologique ?
Cette montée en puissance des modèles de raisonnement intervient alors que les théories de mise à l’échelle, qui reposaient sur l’augmentation continue des capacités via plus de données et de puissance de calcul, sont remises en question. Avec les principaux laboratoires d’IA comme OpenAI et Google peinant à réaliser des avancées notables, est-ce le bon moment pour explorer de nouvelles architectures et techniques, comme le *test-time compute* ?
DeepSeek prévoit de rendre open source DeepSeek-R1 et de lancer une API, des initiatives intrigantes pour une entreprise soutenue par High-Flyer Capital Management, un fonds spéculatif chinois utilisant l’IA. Cette ouverture pourrait-elle stimuler les innovations dans un marché souvent marqué par la rétention de l’information ?
Enfin, que signifie l’émergence d’approches comme celle de DeepSeek pour la recherche et l’application de l’IA dans le monde économique et politique ? Alors que DeepSeek continue d’innover avec ses propres outils et ressources, il reste à voir si cette voie contribuera à la création d’une IA réellement « superintelligente » comme le souhaite Liang Wenfeng.
Est-ce que DeepSeek-R1, avec ses défis et ses promesses, pourrait modifier notre perception de ce qu’un modèle d’IA est capable de faire ?
Source : Techcrunch