Est-ce que l’intelligence artificielle est devenue trop gourmande en ressources informatiques ? Le nuage Google annonce aujourd’hui une nouvelle machine virtuelle A3 de type superordinateur, dans le but de faire face à cette demande croissante.
Qu’est-ce qui rend cette nouvelle machine si spéciale ? L’A3 a été conçue pour répondre à ces cas d’utilisation exigeants où la puissance de calcul est primordiale.
D’après Google, les machines virtuelles A3 sont équipées de GPUs NVIDIA H100 et d’un centre de données spécialisé pour offrir un haut débit et une faible latence à un prix plus raisonnable. Mais qu’en est-il des performances exactes de cette machine ?
L’A3 est conçu pour améliorer la formation des modèles d’apprentissage automatique à grande échelle et réduire les coûts associés.
La machine est alimentée par 8 GPUs NVIDIA H100, des processeurs Intel Xeon Scalable de 4e génération, 2 To de mémoire hôte et 3,6 To/s de bande passante bisectionnelle entre les 8 GPUs via NVSwitch et NVLink 4.0, proposant jusqu’à 26 exaFlops de puissance. Comment cela se traduit-il en termes de formation des modèles d’IA et de traitement des charges de travail ?
Les charges de travail sur ces VMs fonctionnent dans le tissu de réseau Jupiter de Google, qui permet des liens optiques reconfigurables à pleine bande passante. Cela devrait également contribuer à réduire les coûts de fonctionnement de ces charges de travail. Mais comment Google propose-t-il cette nouvelle machine à ses clients ?
Google offrira l’A3 sous deux formes : les clients peuvent l’utiliser eux-mêmes ou sous la forme d’un service géré. La première approche consiste à utiliser les VMs A3 sur Google Kubernetes Engine (GKE) et Google Compute Engine (GCE), tandis que le service géré consiste à utiliser les VMs A3 sur Vertex AI, la plateforme d’apprentissage automatique gérée de l’entreprise. Mais quand pourrons-nous accéder à cette nouvelle machine ?
Les nouvelles VMs A3 ont été annoncées aujourd’hui lors de la conférence Google I/O, mais l’accès n’est pour le moment disponible que via une liste d’attente en avant-première. Serez-vous l’un des premiers à tester ce nouvel outil pour vos projets d’intelligence artificielle ?
Source : Techcrunch