Imagine if, par une charmante matinée ensoleillée, votre grille-pain pouvait vous saluer d’un « Bonjour chaleureux », tout en vous servant une tartine parfaitement dorée. Si cet avenir ressemble encore à un rêve lointain, c’est peut-être parce que créer son propre assistant vocal n’est pas une mince affaire. Les grands de ce monde, tels que Google Assistant, Siri, et Alexa, n’ont pas construit leur réputation sur une poignée de noix de code et deux ou trois gadgets branchés.
Alors, pourquoi diable se lancer dans l’aventure d’un nouvel assistant vocal ? Pour LAION, une organisation allemande à but non lucratif, il s’agit de concilier respect de la vie privée et performance technique, sans la moindre once de compromis. Ils présentent fièrement leur projet BUD-E, un assistant à la voix douce, qui espère un jour gazouiller sur nos appareils grand public.
Cependant, Wieland Brendel, l’un des cerveaux derrière BUD-E, nous confie qu’aucun assistant vocal open source actuel n’est suffisamment modulable pour s’approprier les technologies GenAI d’avant-garde. Vous savez, celles qui font parler les intelligences artificielles comme si elles avaient avalé un dictionnaire en guise de petit-déjeuner.
Et si l’idée est de créer un compagnon artificiel capable de mémoriser vos précédentes palabres, celui-ci aura aussi à cœur de jaser de manière on ne peut plus naturelle. Un vrai caméléon linguistique !
Brendel nous explique que l’idée est d’intégrer BUD-E à toutes sortes d’apps et de services, et ce, sans l’ombre d’une licence restrictive. Un vrai cadeau pour les développeurs en herbe qui rêvent de liberté !
Et pourtant, BUD-E est encore à ses balbutiements. Vous pouvez déjà l’installer depuis GitHub, mais attendez-vous à lui greffer un solide processeur graphique si vous souhaitez qu’il ne bégaye pas.
Dans la même veine, Collabora, une société de conseil technique, met la main à la pâte (gratuitement, s’il vous plaît) pour peaufiner le modèle de reconnaissance et de synthèse vocale intégré à BUD-E. C’est ce qu’on appelle une symbiose technologique des plus altruistes.
Quant aux ambitions futures de LAION, elles sont aussi vastes que le cyberespace : une intelligence émotionnelle accrue pour notre assistant, une mémoire d’éléphant numérique, et une capacité à suivre les conversations de groupe. Un défi !
La priorité immédiate de LAION n’est cependant pas de rendre BUD-E multilingue ou de le doter d’un accent britannique impeccable. « Redéfinissons d’abord l’expérience utilisateur », clame Brendel, avant de fantasmer sur un assistant avec avatar animé ou même capable d’analyser les émotions à travers la webcam. Un projet avec une certaine dose de controverse éthique, mais chez LAION, on insiste sur le respect des normes de sécurité.
On ne va pas tourner autour du pot : les assistants vocaux et leurs données ne sont pas toujours exempts de tout reproche éthique. Mais qui sait, peut-être que BUD-E, avec son nom à consonance affective, fera exception et nous mènera à l’aube d’un nouveau monde numérique… où votre grille-pain vous souhaitera effectivement un bonjour chaleureux. Et c’est là qu’on réalise que ça devrait plutôt être « BUD-Déjeuner ».
Source : Techcrunch