« Quand on veut, on peut… mais encore faut-il avoir le budget et la capacité », disait probablement un sage informaticien. Et justement, à l’occasion de la conférence AWS re:Invent, Amazon a décidé de donner un petit coup de pouce à votre entreprise en améliorant HyperPod, sa plateforme dédiée au développement des modèles de fondation. Ce coup de pouce, c’est un peu comme la fée électricité pour votre machine à café un lundi matin difficile.
HyperPod, cette star du cloud, fait déjà des émules chez Salesforce, Thompson Reuters et BMW ainsi que chez des startups AI comme Luma et Perplexity. Mais, ce ne sont pas les défis qui manquent dans leur activité : trouver la capacité nécessaire pour leurs charges de travail, ça relève souvent du parcours du combattant. Parfois, c’est aussi simple que de trouver un chargeur quand votre téléphone affiche 1% de batterie… une mission impossible.
HyperPod s’attaque au stress des ressources en cloud comme un masseur pro s’attaque aux nœuds dans le dos.
Pour alléger ces moments de panique, AWS propose désormais des « plans d’entraînement flexibles ». L’idée ? Permettre aux utilisateurs d’hyperpod de définir un calendrier et un budget, un peu comme planifier vos vacances, mais en moins amusant. Vous pouvez, par exemple, décider de compléter l’entraînement d’un modèle en deux mois grâce à une combinaison de blocs de capacité, et laissez SageMaker faire le reste. AWS s’occupe aussi de la configuration et gère les pauses café (ou plutôt, les pauses de job).
Mais ce n’est pas tout ! Pour les entreprises qui préfèrent peaufiner plutôt que créer de toutes pièces, AWS dévoile HyperPod Recipes, des recettes optimisées pour des architectures comme Llama et Mistral. C’est un peu comme préparer un soufflé, mais sans risquer qu’il s’aplatisse.
Quand plusieurs équipes grignotent vos ressources comme des petits gâteaux à l’heure du thé, AWS permet désormais de centraliser la capacité GPU. Résultat : moins de gâchis et plus de budget pour les cafés latte et autres douceurs de bureau. Ah, et vous pourrez aussi jongler entre une plus grosse allocation pour l’inférence le jour et l’entraînement la nuit!
Et surprise ! Cette fonctionnalité magique, AWS l’a d’abord conçue pour elle-même, faisant grimper l’utilisation de ses clusters à plus de 90%. Comme quoi, l’auto-suffisance a aussi du bon!
En somme, grâce à ses nouveautés, AWS offre un moyen d’innover tout en réduisant les coûts, jusqu’à 40% selon leurs estimations. Peut-être qu’à ce rythme-là, ils inventeront aussi les imprimantes qui ne se nourrissent pas exclusivement de feuilles coincées.
En guise de conclusion : « Avec AWS, finissez-en avec les maux de tête des serveurs, remplacez-les par plus de capacités de cloud ! »
Source : Techcrunch