OpenAI a récemment annoncé une avancée majeure dans le domaine de l’intelligence artificielle. Mais qu’est-ce que cela signifie réellement pour les développeurs et pour l’avenir des modèles de raisonnement ? Avec l’introduction du modèle AI o1, OpenAI semble s’engager dans une nouvelle ère de l’IA, visant à fournir des réponses plus précises et bien raisonnées. Mais à qui est réellement accessible ce modèle ?
À partir de mardi, le modèle o1 sera accessible aux développeurs classés dans la catégorie « tier 5 » de l’usage chez OpenAI. Mais quels sont les critères pour atteindre ce statut privilégié ? Il semblerait que dépenser au moins 1 000 dollars avec OpenAI et posséder un compte depuis au moins 30 jours soient nécessaires. Mais cela ne limite-t-il pas l’accès à une certaine élite technologique ?
Le modèle o1 vient remplacer le modèle o1-preview disponible sur l’API, et apporte avec lui une approche unique : la capacité de vérifier ses propres faits. Cela semble révolutionnaire, n’est-ce pas ? Toutefois, cette capacité à « raisonner » signifie aussi que les modèles prennent plus de temps pour arriver à une solution, ce qui pourrait être un inconvénient selon les applications.
Le modèle o1 pourrait-il devenir une référence incontournable malgré son coût élevé ?
Il n’est pas anodin de noter que l’utilisation de ce modèle est très coûteuse : 15 dollars pour chaque analyse de quelque 750 000 mots, et 60 dollars pour chaque génération de 750 000 mots. En comparaison, cela représente 6 fois le coût du modèle non-raisonnant GPT-4o. Qui peut vraiment se permettre de tels frais ?
Le modèle o1 dans l’API d’OpenAI se montre plus personnalisable que son prédécesseur o1-preview, notamment grâce à des fonctionnalités comme l’appel de fonctions et l’analyse d’images. Un paramètre intriguant de l’API, « reasoning_effort », permet aux développeurs de contrôler la durée de réflexion du modèle avant de répondre à une requête. Est-ce là un pas vers une personnalisation accrue des interactions avec l’IA ?
OpenAI a également révélé que la version actuelle du modèle dans l’API, ainsi que la future version pour la plateforme ChatGPT, est « post-entraînée ». Cela signifie-t-il que l’IA est devenue encore plus performante ? Selon OpenAI, la nouvelle version « o1-2024-12-17 » améliorerait les comportements basés sur les retours utilisateurs. Cependant, dans quelle mesure ces améliorations se traduisent-elles dans le monde réel ?
Et quant à l’intérêt grandissant pour l’intégration de WebRTC dans les applications de voix en temps réel, OpenAI a frappé un grand coup en embauchant Justin Uberti, le créateur du standard WebRTC. Cette embauche stratégique pourrait-elle transformer OpenAI en leader dans le domaine des applications vocales ? L’ajout du support WebRTC à l’API Realtime, bien que toujours en bêta, démontre des performances accrues sous des conditions de réseau variables.
Avec toutes ces innovations, la question reste : dans quelle direction OpenAI se dirige-t-il avec ces modèles de raisonnement avancé et à quel point cela transformera-t-il le paysage des technologies d’intelligence artificielle ? Avec des coûts élevés et des accès encore restreints, quels seront les effets à long terme sur l’adoption large de ces outils puissants ?
Source : Techcrunch