« Dans l’univers de la technologie, il suffit de cligner des yeux pour manquer quelque chose d’important. Avec l’IA, c’est presque comme si vous ne deviez jamais cligner des yeux… mais ne vous inquiétez pas, ce n’est pas encore le cas ! » Voilà qui résume bien l’actualité autour de l’IA cette semaine. D-Matrix, une startup spécialisée dans les puces IA, a épaté la galerie en levant 110 millions de dollars. Leur ambition ? Commercialiser une « plateforme de calcul d’inférence » qui, selon leurs propres termes, est une première du genre. Une nouvelle ère de IA rentable se profile-t-elle à l’horizon ?
D-Matrix est convaincue d’être l’entreprise qui rendra l’IA générative commercialement viable, un bonheur pour ses investisseurs. Mais est-ce aussi simple ? La promesse est alléchante mais les preuves sont attendues. Entre temps, l’engouement pour ce genre de startups ne fait que mettre en lumière un problème de taille : le manque criant de matériel IA. Nvidia, l’une des principales entreprise qui alimente ce marché, peine à répondre à la demande.
Comment alors imaginer un avenir pour l’IA sans suffisamment de puces pour faire tourner les modèles d’IA? De grandes entreprises comme Microsoft ou Amazon sont déjà en alerte. Microsoft a récemment averti ses actionnaires des possibles perturbations de son service Azure AI si elle ne parvient pas à obtenir assez de puces IA. De son côté, Nvidia ne promet pas de livraisons avant 2024, si ce n’est grâce à la demande élevée de géants de la technologie comme Baidu, ByteDance, Tencent et Alibaba.
« Et si la tech était comme la cuisine, il semble que nous ayons oublié de commander assez de plaques de cuisson pour notre gâteau IA – et on sait tous qu’un gâteau sans cuisson, cela reste de la pâte à gâteau ».
Il est donc crucial pour ces entreprises de développer leurs propres puces de nouvelle génération pour l’inférence de l’IA. Si elles n’ont pas les ressources pour le faire, elles peuvent se tourner vers des startups comme d-Matrix. Une solution qui s’apparente à une chance pour les startups et autres acteurs de l’IA de jouer dans la même cour que les géants de la technologie.
Dans un scenario plus optimiste, d-Matrix et ses semblables pourraient jouer un rôle d’égalisateur, en nivelant le terrain de jeu pour les startups de l’IA générative. En effet, une récente analyse de SemiAnalysis, une entreprise de recherche en IA, démontre une scission du monde de la technologie en groupes « riches en GPU » et « pauvres en GPU ». Les premiers sont majoritairement représentés par Google OpenAI alors que les seconds regroupent des startups européennes et des super-ordinateurs soutenus par le gouvernement, comme Jules Verne en France.
L’inégalité est présente dans l’industrie de l’IA : des annotateurs, qui étiquettent les données utilisées pour former les modèles d’IA générative, aux biais nuisibles qui émergent souvent dans ces modèles formés, l’industrie n’a pas fini de nous surprendre. On peut alors voir les puces d’inférence d’IA disponibles commercialement et à moindre coût comme un élément clé d’une solution future. Néanmoins, on se demande si toutes nos attentes reposent sur les startups comme D-Matrix.
Ainsi, on pourrait conclure en disant que si la technologie était une recette de grand-mère, ici l’ingrédient secret se nomme « innovation ». Une pincée de moyens financiers, quelques cuillères à soupe de volonté et une bonne dose d’énergie, le tout mijoté au feu de l’innovation pourrait bien nous donner un plat surprenant. En fin de compte, la cuisson de l’IA parait moins périlleuse qu’on ne le croyait. Qui a dit que la cuisine et l’IA ne faisaient pas bon ménage?
Source : Techcrunch