Écart type de planéité spectrale - alors qu'est-ce que je mesure conceptuellement?

8

Dans ma quête sans fin pour identifier les ronflements, j'ai trouvé que la "planéité spectrale" semble être une bonne mesure de la "qualité" du signal.

Je calcule la planéité spectrale comme la moyenne géométrique de la puissance FFT (R2+I2) points de données divisés par la moyenne arithmétique des mêmes points.

Je calcule ensuite (un peu ici) la moyenne arithmétique courante (sur 50 images) et l'écart type de la planéité spectrale et calcule un écart type "normalisé" comme l'écart type courant divisé par la moyenne courante.

Pour mes échantillons, je trouve que cette métrique est supérieure à environ 0.2 (allant jusqu'à 0.5 ou ainsi) lorsque l'audio est "bon" (c'est-à-dire que j'ai un suivi fiable des sons de respiration / ronflement d'un sujet endormi) et qu'il glisse généralement en dessous 0.2lorsque l'audio est "dans la boue". (Je peux améliorer quelque peu cette discrimination en utilisant un seuil qui évolue avec d'autres facteurs, mais c'est probablement un sujet différent.) J'observe également que la mesure va au-delà1.0 lorsqu'il y a un bruit de fond important (par exemple, quelqu'un entre dans la pièce et bruit).

Donc, ma question de base est: Y a-t-il un nom (au-delà de "l'écart-type normalisé de planéité spectrale") pour ce que je mesure, et quelqu'un peut-il offrir une explication conceptuelle de ce que la métrique "signifie"?

(J'ai essayé une douzaine d'autres métriques pour la "qualité" du signal, et celle-ci semble être la meilleure à ce jour.)

Ajouté: Je devrais probablement admettre que je n'ai pas une poignée conceptuelle particulièrement bonne sur ce que la planéité spectrale simple mesure (juste l'article Wikipedia ), donc toute explication supplémentaire serait appréciée.

Daniel R Hicks
la source
2
Donc, vous faites un calcul et vous demandez si quelqu'un d'autre a eu la même idée et l'a nommée, et sinon, quelqu'un peut-il proposer une explication conceptuelle de ce que vous avez conçu? Vous avez sûrement dû avoir une justification pour mettre votre "petite touche", ou étiez-vous, comme Indiana Jones, en train de le faire au fur et à mesure?
Dilip Sarwate
3
Je fais simplement des choses au fur et à mesure. Je trouve une technique, je l'applique aux données, j'observe le résultat et je décide si cela semble utile. Si c'est le cas, j'essaie de raffiner. C'est un processus fastidieux, mais "l'expert" en analyse audio travaillant sur ce projet a cassé son choix et est rentré chez lui.
Daniel R Hicks

Réponses:

4

Puisque vous vous intéressez à la "planéité" de votre spectre, en fait, vous vous intéressez à la proximité de votre signal avec un bruit blanc (qui par définition a un spectre plat + phases aléatoires). Si vous reculez, une mesure serait la «distance» de votre observation à la référence de bruit blanc .

La mesure évidente en termes de théorie de l'information est la divergence de Kullback-Leibler . Vous n'avez pas besoin d'en comprendre toutes les parties, mais il mesure en bits (si vous utilisez la base de log 2) la distance entre les deux distributions.

La bonne chose dans votre cas est que votre référence est plate, de sorte que ce qui reste est l' entropie de votre spectre . Il existe de nombreuses implémentations existantes (par exemple dans scipy ).

Notez que vous êtes toujours du bon côté: si votre distribution est approximativement gaussienne, les deux mesures (entropie et std) seront proportionnelles. L'entropie est cependant plus générale et plus raisonnée. En extension, vous pourrez généraliser à d'autres types de bruits (1 / f par exemple).

meduz
la source
La chose étrange est que l'entropie "régulière" - somme de p log p- ne semble pas transmettre beaucoup d'informations pour mon problème. (Bien que je suppose que je n'ai pas essayé de prendre son écart-type.)
Daniel R Hicks
3

Toute différence fiable et cohérente dans les statistiques de votre signal (ou une fonction de votre signal, comme son spectre) et le bruit dans lequel votre signal est intégré peuvent être utilisées pour estimer une probabilité de l'un par rapport à l'autre.

Vous semblez avoir trouvé au hasard (tombé sur) l'une des nombreuses possibilités de caractériser la forme du spectre du signal qui différencient le signal souhaité de choses plus proches du bruit blanc ou des pics d'impulsion. Trébucher sur une solution aléatoire possible ne meurt pas l'invalider (c'est une base de la programmation évolutive / génétique). Mais la robustesse d'une mesure que vous avez trouvée reste un exercice expérimental.

hotpaw2
la source
Le fait est que d'autres mesures, comme l'entropie régulière, n'ont pas montré autant de promesses que cette mesure. Si je pouvais comprendre pourquoi celle-ci semble meilleure, je pourrais peut-être l'améliorer.
Daniel R Hicks
hotpaw2, Vous mentionnez d'autres moyens qui permettent de faire la différence entre un signal et un bruit - ou une certaine «mesure» de la forme d'un spectre de magnitude FFT - de quels moyens exactement pensez-vous?
Spacey
Viens exactement à l'esprit ??? On dit parfois que les algorithmes de recherche de type évolutionnaire / génétique / Hadoop extraient, à partir de suffisamment de données, des "formes" qui ne viennent pas à l'esprit ni ne sont généralement décrites comme exactes, jusqu'à peut-être après coup.
hotpaw2
@ hotpaw2 Désolé, ma question n'était peut-être pas claire - je me demandais simplement comment des moyens simples de mesurer, par exemple, le «pic», pouvaient exister (comme exemple de l'apparence d'un spectre). Je ne demandais rien de trop sophistiqué, bien que ces méthodes d'apprentissage non supervisées que vous avez mentionnées soient certainement puissantes.
Spacey