« L’intelligence artificielle est comme la pizza, on pense avoir tout vu, et un jour, quelqu’un invente la pizza au chocolat. » Cette semaine, MiniMax, étonnant enfant des géants Alibaba et Tencent, a dévoilé non pas une, pas deux, mais trois nouvelles variantes d’IA qui sont sorties de leurs circuits pour rivaliser avec les stars américaines de l’IA. Avec 850 millions de dollars en capital-risque et une valorisation qui dépasse les 2,5 milliards, MiniMax s’est installé confortablement dans le paysage des licornes numériques.
Alors, quelles sont nos nouvelles pizzas high-tech ? MiniMax-Text-01, une amoureuse exclusive des mots ; MiniMax-VL-01, qui n’est pas monogame puisqu’elle aime aussi bien les images que le texte ; et T2A-01-HD, la diva de la voix synthétique qui pourrait bien faire rougir Siri. Parmi ces trois, MiniMax-Text-01 se distingue avec ses 456 milliards de paramètres, se vantant d’un palmarès digne des plus grands contre Google Gemini 2.0 Flash sur des tests comme MATH et SimpleQA.
Quant à MiniMax-VL-01, elle flirte avec l’excellence d’Anthropic’s Claude 3.5 Sonnet pour sa compréhension multimodale, mais reste peut-être légèrement à la traîne derrière quelques poids lourds. Mais attention, amis geeks, MiniMax-Text-01 est un monstre de contextes : avec une capacité de 4 millions de tokens, elle avale vos écrits tels cinq copies de « Guerre et Paix » sans rechigner.
MiniMax pourrait bien rebattre les cartes du monde de l’IA, donnant aux géants américains une raison de se lever du bon pied.
Et, oui, côté audio, T2A-01-HD ne fait pas semblant non plus. En une dizaine de secondes d’enregistrement, cette IA peut cloner une voix dans 17 langues différentes. Dommage qu’on ne puisse pas vous faire entendre nos tentatives de karaoké grâce à elle, mais il paraît que le résultat est à la hauteur des espérances. Reste que MiniMax garde ses cartes IA assez près de sa veste, avec des licences restrictives et une définition d’ouverture qui ferait frémir un hacker marié à la transparence.
Les fondateurs de MiniMax, anciens de SenseTime, une grosse pointure chinoise, ont décidé de ne pas jouer petits bras. Leurs créations comme Talkie, bien qu’un brin controversées — une app qui a joué avec les célébrités sans leur permission — continuent de faire des vagues. Ajoutez à cela des suspicions de formation sur des données un peu trop « empruntées » et vous obtenez un cocktail assez explosif.
Mais la Chine et ses aventuriers de la tech ne sont pas au bout de leurs peines. Avec des restrictions américaines à l’export d’AI et de puces menaçant d’étrangler leurs capacités technologiques, la scène IA asiatique devra jouer serré, et peut-être même revoir son jeu d’échecs. Faisant face aux nouvelles règles scrutinantes de l’administration Biden, ces start-ups devront redoubler d’innovations pour rester dans la partie, quitte à réinventer le deep learning comme un bon vieux camembert oublié devenu popularité Ember.
La bataille technologique et géopolitique à qui mieux mieux entre les États-Unis et la Chine continue, transformant chaque annonce IA en un feu de joie pour les stratèges autant que pour les ingénieurs. Une chose est sûre, comme on le dit dans le milieu, « l’IA avance à pas de géant, mais gare aux fausses notes, sinon elle pourrait bien danser un tango mal synchronisé. »
Restez à l’écoute, car l’ère des machines intelligentes n’a pas fini de nous surprendre, entre deux tranches de code bien garnies.
Source : Techcrunch