« S’il y a une volonté, Objaverse est la voie ! » C’est ainsi que l’intelligence artificielle franchit une étape supplémentaire pour mieux comprendre notre monde tridimensionnel. L’Allen Institute for AI a développé une base de données massive et diversifiée de modèles 3D d’objets du quotidien pour améliorer l’apprentissage des IA et les rendre plus proches de la réalité.
Les simulateurs sont des environnements 3D conçus pour représenter des lieux réels que les robots ou les IA doivent parcourir ou comprendre. Cependant, contrairement aux jeux vidéo modernes, les simulateurs d’entraînement manquent souvent de réalisme, de détails, de variété ou d’interactivité.
Objaverse, au nom étrange mais amusant, ambitionne de résoudre ces problèmes grâce à sa collection de plus de 800 000 modèles 3D (et en expansion) accompagnés de multiples métadonnées. Les objets représentés vont des types de nourriture aux tables, chaises, appareils électroménagers et gadgets en tout genre que l’on retrouve dans les maisons, les bureaux ou les restaurants.
Objaverse ouvre la voie à une meilleure compréhension des espaces et des objets pour l’intelligence artificielle.
Objaverse vise à remplacer les bibliothèques d’objets obsolètes, comme ShapeNet et ses 50 000 modèles moins détaillés. En effet, si une IA ne connaît qu’une lampe générique sans motif ni couleur, comment peut-elle reconnaître une lampe en verre taillé ou en forme de cône ? La base de données Objaverse propose des variations d’objets communs pour apprendre à l’IA comment les identifier malgré leurs différences.
Certes, il est probablement inutile que votre assistant IA puisse différencier une étagère « médiévale », mais il devrait au moins distinguer une banane pelée d’une banane non pelée. On ne sait jamais ce qui pourrait être important.
En utilisant des images photoréalistes (obtenues par photogrammétrie), Objaverse apporte également un niveau de diversité et de réalisme inédit. Par exemple, tous les lits se ressemblent lorsqu’ils sont faits, mais qu’en est-il des lits défaits ? Tous différents !
Les objets animés qui accomplissent leur « fonction principale » sont également utiles. Connaître l’apparence d’un réfrigérateur, d’une armoire, d’un livre, d’un ordinateur portable ou d’un portail fermé est une chose, ouvert en est une autre, mais comment passe-t-on de A à B ? Cela semble simpliste, mais si les modèles d’IA ne reçoivent pas ces informations, ils ne sont pas susceptibles de les inventer ou de les deviner.
Pour en savoir plus sur les caractéristiques et les détails de cette gigantesque base de données, n’hésitez pas à consulter l’article d’AI2 qui la décrit. Si vous êtes chercheur, vous pouvez dès maintenant l’utiliser gratuitement via Hugging Face.
Source : Techcrunch