« Dans le monde de l’IA ouverte, il y a toujours une place pour les bonnes nouvelles ! » Ainsi pourrait-on annoncer l’arrivée fracassante de la nouvelle famille de modèles IA sur notre scène technologique préférée. Oubliez les dinosaures de la tech, voici un petit nouveau qui s’invite et il est bien décidé à marquer les esprits. OLMo 2, tel un roi lion, rugit haut et fort !
Propulsé sur le devant de la scène ce mardi par AI2, un organisme de recherche non lucratif fondé par le regretté Paul Allen, OLMo 2 n’est pas juste un autre modèle au nom rigolo. Il se distingue par sa capacité à être reproduit à partir de zéro, un exploit rare dans le domaine trépidant des modèles de langage. Si vous pensiez que l’open source était un club sélect, pensez à nouveau ! OLMo 2 respecte la définition de l’Open Source Initiative, garantissant que tous les outils et données utilisés pour le développer sont disponibles pour les curieux et les audacieux d’entre nous.
Avec deux modèles en son sein – OLMo 7B et OLMo 13B – cette famille se fend d’un potentiel de résolution de problèmes qui ferait rougir bien des algorithmes. Oubliez la taille, ici, chaque paramètre compte, et plus il y en a, mieux c’est.
À l’ère de l’open source, le partage c’est l’atout gagnant !
Ce n’est pas tout. Dans une mer de modèles dominée par de grandes entités comme Meta avec son Llama, OLMo 2 fait des vagues en éclipsant certains de ses concurrents. Fi de la modestie, OLMo 2 7B promet une performance qui dépasse même le Llama 3.1 8B de Meta. Prenez une grande inspiration et criez « Eureka ! »
Un petit tour dans les coulisses nous apprend que le secret de ces performances réside dans un ensemble de données formé de 5 000 milliards de tokens (de quoi donner un bon mal de tête numérique !) tirés de sites web triés sur le volet et divers documents allant des travaux académiques aux livres de mathématiques artificiels et humains.
Toutefois, avec un grand pouvoir vient… une grande responsabilité. Des questions autour de la sécurité des modèles ouverts se posent, notamment depuis que certaines mains indélicates auraient détourné les modèles Llama à des fins moins louables. Dirk Groeneveld, l’homme derrière la machine chez AI2, reste optimiste. Selon lui, les avantages de l’ouverture surpasseraient les craintes potentielles : l’accès à l’IA équitable pour tous reste en tête des priorités.
En définitive, OLMo 2 se profile comme un des modèles de langage ouvert les plus performants disponibles, et ce, sous licence Apache 2.0 pour le plus grand bonheur des développeurs gourmands de liberté. Préparez vos souris et claviers, car télécharger OLMo 2 pourrait être votre meilleure décision de la journée. Après tout, comme on dit chez nous, l’OLMo ne tombe jamais loin de l’arbre de l’innovation !
Source : Techcrunch