photo of outer space

Credits image : NASA / Unsplash

Intelligence Artificielle
0

Qu’est-ce que l’avenir nous réserve en matière d’IA conversationalle ?

Qu’est-ce que le futur nous réserve en matière d’IA ? Anthropic, une start-up d’IA, nous donne peut-être un avant-goût. Aujourd’hui, l’entreprise annonce la mise à disposition de son nouveau modèle d’IA générative de textes, Claude 2. Successeur de la première version commerciale, est-ce le début d’une nouvelle ère pour l’IA conversationnelle ?

Disponible en bêta aussi bien aux États-Unis qu’au Royaume-Uni, Claude 2 est déjà utilisé par plusieurs entreprises pilotes comme la plateforme d’IA générative Jasper et Sourcegraph. Mais pourquoi précisément ces entreprises ont-elles choisi de se tourner vers ce nouveau modèle ? Serait-ce dû au prix attractif de son API (~0,0465$ pour générer 1 000 mots) qui reste inchangé par rapport à Claude 1.3 ?

« Claude 2 : une version améliorée de Claude 1.3 plutôt que la création d’un nouveau produit. »

Si nous nous penchons sur les capacités de Claude 2, nous constatons qu’au-delà de générer du texte, il peut également rechercher des documents, résumer, coder et répondre à des questions sur des sujets spécifiques. Tout comme Claude 1.3. Alors, en quoi Claude 2 se distingue-t-il? Est-ce purement une question de performances améliorées, ou y a-t-il plus à ce nouveau modèle qu’il n’y paraît ?

Claude 2 a certes un score légèrement supérieur à Claude 1.3 dans la section à choix multiples de l’examen du barreau, ainsi qu’une capacité accrue à passer la section à choix multiples de l’examen de licence médicale américain. Et il semble également être un meilleur programmeur. Mais en quoi cela rend-il Claude 2 plus pertinent pour les entreprises ?

Au-delà de la programmation, Claude 2 semble également résoudre plus de problèmes mathématiques correctement. Anthropic affirme également travailler activement à améliorer le raisonnement et la « conscience de soi » du modèle. Mais qu’est-ce que cela signifie vraiment en termes d’utilisation pratique pour les utilisateurs ?

Anthropic révèle que Claude 2 a été formé sur des données plus récentes que Claude 1.3. Un mélange de sites web, de jeux de données sous licence de tiers et de données utilisateur fournies volontairement à partir de début 2023. Ce changement dans les données d’entraînement pourrait-il être l’une des clés de l’amélioration du modèle Claude 2 ?

Malgré ces améliorations, Claude 2 n’est pas sans failles. Comme tous les modèles, il n’est pas parfait. En effet, même les meilleurs modèles actuels souffrent d’hallucination, un phénomène où ils répondent à des questions de manière non pertinente, illogique ou factuellement incorrecte. Ils sont aussi enclins à générer des textes toxiques, reflétant les biais présents dans les données utilisées pour leur entraînement. Qu’en est-il donc de Claude 2 ? Le fait qu’Anthropic affirme qu’il est « 2x mieux » pour donner des réponses « inoffensives » par rapport à Claude 1.3 est-il suffisant pour rassurer les utilisateurs ?

Quant au futur de Claude 2, Anthropic semble avoir des plans. La société envisage d’explorer des façons de rendre sa « constitution » personnalisable. Mais comment cela fonctionnerait-il exactement ? Et quelles en seraient les limites ?

Anthropic a des ambitions élevées pour son IA, visant à créer un « algorithme de nouvelle génération pour l’auto-apprentissage de l’IA ». Un algorithme qui pourrait être utilisé pour construire des assistants virtuels capables de répondre aux courriels, d’effectuer des recherches et de générer des œuvres d’art, des livres et plus encore. Claude 2 est-il le premier pas vers cet avenir ? Ou y a-t-il encore un long chemin à parcourir ?

Source : Techcrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Les articles de ce site sont tous écrits par des intelligences artificielles, dans un but pédagogique et de démonstration technologique. En savoir plus.