Paroles de lunettes : le futur silencieux de la communication

« La parole est d’argent, mais le silence est d’or » – et dans le cas du nouveau projet de l’Université Cornell, le silence pourrait bien prendre la parole grâce à la technologie. Un chercheur de Cornell a développé des lunettes à sonar qui « entendent » ce que vous dites sans parler. La monture de ces lunettes utilise de minuscules haut-parleurs et microphones pour lire les mots que vous formez avec votre bouche tout en donnant des commandes silencieuses à des appareils tels que la musique, le téléphone ou des modèles de CAO.

Ce système a été élaboré par Ruidong Zhang, étudiant en doctorat à Cornell. Il s’agit de la version améliorée d’un projet similaire utilisant des écouteurs sans fil et des modèles basés sur des caméras. La nouveauté est que les lunettes n’ont pas besoin d’être face à une caméra ou d’avoir quelque chose dans l’oreille. Le professeur assistant en informatique de Cornell, Cheng Zhang, a déclaré : « La plupart des technologies de reconnaissance de la parole silencieuse sont limitées à un ensemble de commandes prédéterminées et nécessitent que l’utilisateur porte ou fasse face à une caméra, ce qui n’est pas pratique. »

Les lunettes sonar pourraient révolutionner la communication silencieuse et aider les personnes souffrant de troubles de la parole.

Les chercheurs expliquent que le système nécessite seulement quelques minutes de données d’entraînement pour apprendre les modèles de parole de l’utilisateur. Ensuite, il envoie et reçoit des ondes sonores à travers le visage, détecte les mouvements de la bouche et utilise un algorithme d’apprentissage profond pour analyser les profils d’écho en temps réel avec une précision d’environ 95%.

Le traitement des données est réalisé sans fil par le smartphone, ce qui permet au dispositif de rester petit et discret. La version actuelle offre une autonomie d’environ 10 heures pour la détection acoustique. De plus, aucune donnée ne quitte le téléphone, ce qui élimine les préoccupations liées à la vie privée. « Nous sommes très enthousiastes à propos de ce système car il fait vraiment avancer le domaine en termes de performances et de respect de la vie privée », déclare Cheng Zhang.

La question de la vie privée intervient également lorsqu’on explore des applications possibles dans la vie réelle. Par exemple, Ruidong Zhang suggère de l’utiliser pour contrôler la lecture de musique dans une bibliothèque silencieuse ou pour dicter un message dans un concert bruyant où les options standard échoueraient. Le potentiel le plus intéressant réside peut-être dans l’aide aux personnes souffrant de certains types de troubles de la parole qui pourraient l’utiliser pour alimenter en silence un synthétiseur vocal reproduisant les mots à haute voix.

Si tout se passe comme prévu, il pourrait être possible de mettre la main sur cette technologie un jour. L’équipe du laboratoire SciFi (Smart Computer Interfaces for Future Interactions) de Cornell étudie la possibilité de commercialiser cette technologie grâce à un programme de financement de l’université. Ils s’intéressent également aux applications des lunettes intelligentes pour suivre les mouvements du visage, des yeux et du haut du corps. « Nous pensons que les lunettes seront une plateforme informatique personnelle importante pour comprendre les activités humaines dans les situations quotidiennes », déclare Cheng Zhang.

Source : Engadget