« Pourquoi surveiller des robots, si on peut les entraîner à devenir leurs propres chiens de garde ? » pourrait-on se demander en parcourant les dernières innovations du MIT. Cette semaine, des chercheurs de la célèbre institution ont levé le rideau sur un nouveau modèle d’apprentissage pour les robots. Loin de se reposer sur le traditionnel petit lot de données focalisées, la méthode nouvelle génération s’inspire des vastes jungles d’informations qui forment les grands modèles de langage (LLMs pour les intimes).
Une des limites de l’imitation reste sa sensibilité aux situations inédites. Imaginons votre robot domestique obligé de jongler avec des variations de lumière ou des obstacles tout neufs. Mauvaise nouvelle : il pourrait rester sur le carreau, faute de données suffisantes pour s’adapter. C’est un peu comme demander à votre chat de devenir un chien de berger du jour au lendemain : il lui manque la perspective d’ensemble !
Le secret résiderait ainsi dans le recours à un modèle de poids lourd façon GPT-4, bombardant le problème avec une masse de données quasi imparable.
Si l’environnement change, assurons-nous que le robot ne perde pas ses boulons.
Faisons place à la star de l’heure, l’architecture nommée Heterogeneous Pretrained Transformers (HPT, pour les intimes), qui aspire tout depuis différents capteurs et environnements pour concocter des modèles d’entraînement. Plus le transformateur gronde, plus le résultat scintille. Au lieu de caresser l’idée classique de robotisation, pourquoi ne pas viser une sorte de nuée informatique multisensorielle ?
Imaginez, un simple téléchargement et hop, votre robot se télécharge un cerveau tout neuf, prêt à l’emploi, zéro formation ! C’est en tout cas le rêve de David Held, un professeur de l’université Carnegie Mellon, qui espère qu’en grossissant l’échelle, on finira par provoquer un grand wow dans le domaine des politiques robotiques, comme c’était le cas avec les grands modèles langagiers.
Derrière cette avancée, un petit coup de pouce du Toyota Research Institute. Souvenez-vous, l’année dernière lors de TechCrunch Disrupt, TRI avait dévoilé une méthode d’apprentissage robotique capable de se dérouler le temps d’une nuit. Dernièrement, une collaboration phare a uni sa recherche sur l’apprentissage des robots avec le matériel de Boston Dynamics. Les bras mécaniques et les cerveaux numériques, enfin main dans la main ? Espérons que ça débouche sur plus de prouesses robotiques que de gaffes dignes de clowneries !
Source : Techcrunch