Nous vous en parlions en début d’année, en 2023 Nabu Casa, la société fondatrice du système domotique Home Assistant a comme fil rouge ambitieux cette année, l’élaboration de son propre assistant vocal. Un assistant similaire à Siri Google ou Alexa, mais exclusivement orienté pilotage de la domotique et la maison connectée.
Un projet de grande envergure, d’autant que les promesses sont grandes. L’équipe HA et ses 188 contributeurs promettent un assistant totalement indépendant du cloud et donc très réactif et respectueux en matière de collecte de données à notre insu. Mais c’est également un assistant qui promet la prise en charge dans pas moins de 56 langues.
L’année de la voix, un long chemin à parcourir pour Home Assistant en plusieurs chapitres
Après un premier chapitre en début d’année qui a dressé les milestones du projet, défini les objectifs et recherché les très nombreux collaborateurs pour traduire les commandes courantes de la maison intelligente dans toutes les langues disponibles. Une seconde Phase a introduit la partie audio de cette nouvelle commande vocale. En effet, pour ce projet Nabu casa ne s’appuie sur aucun projet tel que celui de Google ou d’Amazon, mais a fait le choix de la totale maîtrise avec un projet maison, ce qui impose de devoir gérer tous les aspects du projet. Cette seconde phase a également introduit le fonctionnement local pour une confidentialité maximale en plus de la prise en charge de Home Assistant Cloud pour une large couverture linguistique.
En phase 3 du projet, l’équipe est allée encore plus loin en ajoutant la possibilité de définir l’assistant vocal de Home Assistant comme assistant par défaut sur les téléphones Android. Une nouvelle étape importante à franchir qui ramène l’assistant vocal domotique au même rang que ceux des géants de Google, Amazon et Apple, ce qui n’est pas rien.
Pas de mot réveil unique pour déclencher l’assistant vocal domotique de Home Assistant
Ce n’est pas un mot réveil unique comme chez Google, Apple ou Amazon mais à l’utilisateur de définir son mot réveil favori avec Home Assistant. Là encore Nabu Casa innove et fait mieux que Google Amazon ou Apple en proposant dans la phase 4 du projet, l’introduction de la définition du mot réveil. À la différence de Hey Google, Alexa ou Dis Siri, l’assistant vocal de HA permet un nouveau modèle de base pour le mot d’éveil de la synthèse vocale.
Découvrez un premier aperçu de la commande vocale dans cette première vidéo :
Mieux encore, découvrez un autre utilisateur qui montre dans cette autre vidéo qu’il utilise un autre mot clé pour invoquer son assistant domotique, mais surtout qui donne un peu plus de projection sur les projets qui vont se décliner avec ce Driod R2 imprimé en 3D, doté de capteurs, micros et haut-parleurs qui permettent à l’utilisateur d’interagir avec sa domotique de manière très intéressante.
Le choix du mot d’éveil : Une véritable prouesse technique
Les mots éveillés sont difficiles à construire. Ils sont basés sur l’IA, il y a peu de place pour les faux positifs et ils doivent fonctionner extrêmement rapidement. Vous ne pouvez pas demander à un assistant vocal de commencer à écouter 5 secondes après qu’un mot d’activation soit prononcé. Les moteurs de détection de mots d’éveils ont donc besoin d’experts en matériel pour optimiser les modèles afin qu’ils fonctionnent correctement.
La capture audio possible depuis différents appareils dans la maison
En effet, les équipes de développement ont pensé un système qui soit polyvalent pour permettre de piloter le système domotique à la voix depuis de multiples appareils simples et économiques. Pour permettre cela, la détection des mots d’activation est faite dans Home Assistant. Les appareils vocaux d’écoutes, aussi nommés satellites, échantillonneront constamment l’audio de la pièce pour y détecter une voix. Lorsqu’ils détecteront une voix, les satellites enverront l’audio à Home Assistant qui vérifiera si le mot d’éveil a été prononcé et gérera la commande qui l’a suivi. Pas de soucis de latence étant donnée que tout cela se passe en local.
L’avantage de cette approche est que tout appareil qui diffuse de l’audio peut être transformé en satellite vocal, même s’il ne dispose pas de suffisamment de puissance pour détecter localement les mots de réveil. Cela permet d’envisager de créer un satellite pour quelques euros seulement avec un ESP32 ou encore recycler les vieux Raspberry Pi en qualité de satellite vocal associé à un micro sur interface USB qui embarque des puces de traitement audio qui nettoient et améliorent la capture.
L’inconvénient de cette approche est que chaque satellite nécessite des ressources continues dans Home Assistant lorsqu’il diffuse de l’audio. Avec notre approche actuelle, les utilisateurs peuvent exécuter 5 satellites vocaux sans surcharger un Raspberry Pi 4 qui héberge Home Assistant (en supposant que tous les satellites diffusent en même temps).
L’assistant vocal de Home Assistant avance bien !
Le projet avance bien, les bases sont maintenant bien posées et l’équipe va pouvoir s’attaquer à toutes les parties d’apprentissages et autres fonctions primaires à dédier à l’assistant pour sa sortie. Nous avons hâte d’en voir plus dans les prochaines étapes tant le projet est prometteur. Pouvoir réutiliser du matériel en tant que satellite ou permettre de fabriquer un satellite pour quelques euros est un point intéressant. Il nous manque encore une information, savoir si nous pourrons réutiliser ou décliner un vieux Amazon Echo ou Google Home en tant que Satellite, ce qui serait un vrai plus, mais cela reste très incertain étant donné que ces appareils sont logiciellement difficiles d’accès. Affaire à suivre, mais la domotique aura bientôt sa voix, c’est une certitude.
Add Comment