Je suis en train de comprendre comment mon iPhone peut écouter sans cesse pour me dire Hey Siri
, Alexa
, Hey Cortana
ou Okay Google
sans vider rapidement ma batterie vers le bas.
J'ai imaginé deux types d'algorithmes. Celui qui enregistre une tranche de temps telle que des tranches larges de 10 ms toutes les 200 ms et effectue une détection synchrone sur des fréquences spécifiques. Cependant, ces paramètres dépendent fortement des caractéristiques de ma voix. De plus, il consommera toujours beaucoup de puissance CPU pour essayer continuellement de faire correspondre un Hey Siri
au milieu de nulle part.
Quel type d'algorithme / implémentation efficace à faible puissance (matériel ou logiciel) peut effectuer une telle tâche?
Ceci est en quelque sorte lié à ce brevet, je pense: https://www.google.com/patents/US20160253997
J'ai lu quelques articles qui parlent de modèles Markov cachés, mais je doute que ce soit une approche à très faible puissance.