« Un bon programmeur est celui qui regarde des deux côtés avant de traverser une rue à sens unique ». Cette citation de Doug Linder pourrait décrire l’ambition conduite par Anthropic, la startup d’IA montée par d’ex-cadres de OpenAI. En effet, ils viennent de dévoiler une version améliorée de leur modèle de génération de texte, Claude Instant, plus rapide, sur le fil et moins cher, par le biais d’une API.
Cette mise à jour, baptisée Claude Instant 1.2, intègre les atouts de Claude 2, le modèle phare récemment lancé par Anthropic. L’entreprise souligne des gains « significatifs » dans des domaines tels que les mathématiques, la programmation, le raisonnement et la sécurité. Lors des tests internes, Claude Instant 1.2 a récolté 58,7% sur un benchmark de codage contre 52,8% pour Claude Instant 1.1, et 86,7% sur un ensemble de questions de maths contre 80,9% pour Claude Instant 1.1.
« Claude Instant génère des réponses plus longues, plus structurées et suit mieux les instructions de formatage », écrit Anthropic dans un article de blog. On observe aussi une amélioration en termes d’extraction de citations, de capacités multilingues et de réponses aux questions avec Instant 1.2.
« Claude Instant 1.2 est plus structuré, moins enclin à l’hallucination et plus résistant aux tentatives de jailbreaking. »
L’une des façons d’évaluer un modèle de langage comme Claude est de vérifier qu’il ne produit pas des textes incorrects ou dénués de sens, ce qu’on appelle ‘l’hallucination’, ou qu’il ne se laisse pas berner par des consignes ingénieusement rédigées pour contourner les barrières de sécurité mises en place par leurs créateurs, procédé surnommé ‘jailbreaking’. Eh bien Claude Instant 1.2 semble moins enclin à ces deux phénomènes, d’après Anthropic.
Un autre aspect notable de Claude Instant 1.2 est qu’il dispose d’une fenêtre de contexte, autrement dit le texte que le modèle considère avant de générer du texte supplémentaire, de la même taille que celle de Claude 2 – 100 000 tokens. Pour vous donner une idée de la taille, Claude Instant 1.2 et Claude 2 peuvent analyser environ 75 000 mots, soit à peu près la longueur de « The Great Gatsby ».
Grâce à cette fenêtre de contexte, les modèles comme Claude Instant 1.2 sont moins susceptibles « d’oublier » le contenu des conversations précédentes. Ainsi, nous pourrions imaginer des assistances virtuelles capables de répondre à des mails, de réaliser des recherches et de générer de l’art, des livres et bien d’autres choses encore. Oui, nous avons déjà eu un aperçu de ces possibilités avec des modèles de langage comme GPT-4.
Néanmoins, même si Claude Instant semble prometteur, rappelons qu’il n’est pas encore cet algorithme auto-apprenant nouvelle génération que Anthropic espère créer. Pour l’instant, il se positionne en concurrent des offres d’entrée de gamme de OpenAI, ainsi que des startups comme Cohere et AI21 Labs, toutes se lançant dans la course aux systèmes IA de génération de texte et, dans certains cas, d’images. Pour accomplir sa vision, Anthropic estime qu’il lui faudra 5 milliards de dollars sur les deux prochaines années… une somme qui dépasse de loin les 1,45 milliard de dollars récoltés jusqu’à présent.
Source : Techcrunch