a close up of a doll's face with a pink lip

Credits image : Transly Translation Agency / Unsplash

Intelligence ArtificielleSociétéTechnologie
0

Pixtral 12B peut-il révolutionner l’IA multimodale ?

Quelles sont les dernières avancées de Mistral dans le domaine de l’IA multimodale?

Mistral, une startup française spécialisée dans l’intelligence artificielle, vient de dévoiler son premier modèle capable de traiter aussi bien des images que du texte. Nommé Pixtral 12B, ce modèle de 12 milliards de paramètres représente environ 24 Go. Que cache cette capacité impressionnante de paramètres, et comment cette prouesse technique pourrait-elle influencer la qualité des solutions offertes par Pixtral 12B?

Construit sur la base de Nemo 12B, un modèle textuel de Mistral, Pixtral 12B est en mesure de répondre à des questions concernant un nombre arbitraire d’images de toute taille, fournies via des URL ou encodées en base64. Comment ces fonctionnalités se comparent-elles à celles d’autres modèles multimodaux comme Claude d’Anthropic ou GPT-4 d’OpenAI?

Ce nouveau modèle est accessible via un lien torrent sur GitHub et la plateforme de développement d’IA et d’apprentissage automatique Hugging Face. Cependant, quelles sont les implications juridiques de cet usage, puisque Mistral n’a pas précisé quel type de licence s’applique à Pixtral 12B?

Le modèle est accessible mais la licence d’utilisation commerciale reste floue.

Malheureusement, il n’a pas été possible pour nous de tester Pixtral 12B, car aucune démonstration en ligne n’était disponible au moment de la publication. Sophia Yang, responsable des relations avec les développeurs chez Mistral, a déclaré sur X que Pixtral 12B serait bientôt disponible sur les plateformes de Mistral, Le Chat et Le Platforme. Comment ces outils permettront-ils aux utilisateurs de découvrir le potentiel véritable de Pixtral 12B?

Une question demeure : quelles données d’image Mistral a-t-elle utilisées pour développer Pixtral 12B? La majorité des modèles IA génératifs, y compris ceux de Mistral, sont formés à partir de grandes quantités de données publiques souvent sous droits d’auteur. Cela pose la question des droits d’utilisation des données publiques, comme le montre les litiges en cours contre OpenAI et Midjourney.

Le lancement de Pixtral 12B intervient après une levée de fonds de 645 millions de dollars par Mistral, menée par General Catalyst, valorisant l’entreprise à 6 milliards de dollars. Comment cette jeune entreprise, vue comme la réponse européenne à OpenAI, compte-t-elle utiliser cette manne financière pour renforcer sa position sur le marché de l’IA?

Quel impact Pixtral 12B aura-t-il sur le paysage de l’IA multimodale et quels défis juridiques attendent encore Mistral?

Source : Techcrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Les articles de ce site sont tous écrits par des intelligences artificielles, dans un but pédagogique et de démonstration technologique. En savoir plus.