“Etre ou ne pas être, tel est le binaire”, a-t-on souvent dit dans le monde des robots. Et bien, il semble que les robots de Google DeepMind aient décidé d’être et de vadrouiller tranquillement dans les bureaux dès qu’on le leur demande.
La team DeepMind Robotics de Google, toujours en quête de nouvelles prouesses, a récemment publié un article faussement barbare intitulé « Mobility VLA: Multimodal Instruction Navigation with Long-Context VLMs and Topological Graphs ». En gros, ils racontent comment ils ont utilisé Google Gemini 1.5 Pro pour enseigner à un robot à répondre aux commandes et à naviguer dans un bureau. Pratique pour guider un collègue perdu dans l’open-space des 9 000 pieds carrés !
Les robots en question ne viennent pas de n’importe où. Ils sont issus du défunt projet Every Day Robots, abandonné par Google l’année dernière suite à des licenciements massifs. Mais au lieu de pleurer leur sort dans un coin, ces robots se sont recyclés en GPS de bureau avec un sens de l’humour plutôt rigolo.
Les robots de DeepMind savent où aller mais prennent parfois des chemins de traverse.
Dans une série de vidéos, les employés de DeepMind lancent des ordres du style “OK, Robot” avant de demander au système d’accomplir diverses tâches dans le bureau. Dans une vidéo, un employé demande au robot de l’emmener quelque part pour dessiner. En moins de temps qu’il ne faut pour dire “intelligence artificielle”, le robot mène l’humain à un gigantesque tableau blanc, avec une confiance en soi que beaucoup d’entre nous envieraient.
Avant de tourner ces vidéos, les robots ont été familiarisés avec l’espace grâce à ce que l’équipe appelle « Multimodal Instruction Navigation with demonstration Tours (MINT) ». En gros, faire une visite guidée du bureau en leur montrant les points de repère. Grâce à un savant mélange de Vision-Language-Action (VLA), les robots peuvent répondre à des commandes écrites, dessinées, voire gestuelles. Vous pensiez qu’il fallait parler binaire à ces machines ? Que nenni !
Enfin, il est bon de noter que le taux de réussite du robot avoisine les 90 % sur plus de 50 interactions avec les employés. Une performance digne de figurer dans les annales du GPS de bureau, si tant est qu’elles existent. Qui sait, peut-être demain dirons-nous à notre collègue perdu : “Demande plutôt au robot, il a le sens de l’orientation !”
En conclusion, quand on parle de robots qui naviguent dans des bureaux, ce n’est pas de la science-fiction, c’est déjà de la réalité chez Google DeepMind. Et qui sait ? Un jour, peut-être que Waze tremblera devant leur créativité. En attendant, réjouissons-nous de chaque petit pas de ces robots, car après tout, “chaque grand voyage commence par un simple ‘OK, Robot’”.
Source : Techcrunch