Quelles sont les mathématiques derrière la propriété de réduction du bruit du filtre médian?
8
Je suis intéressé à comprendre la raison mathématique pour laquelle l'application d'un filtre médian sur une image (ou un signal) entraîne une réduction du bruit.
L'efficacité d'un filtre médian dépendrait du type de bruit. Le bruit avec une valeur médiane de 0, par exemple le bruit gaussien blanc additif (AWGN) serait assez bien coupé avec des échantillons suffisants. Si le bruit est une autre forme d'interférence (évanouissement par trajets multiples), un filtre médian n'aidera pas vraiment.
Nick T
Réponses:
13
Intuition: L'intuition est la suivante: votre bruit est un événement ou des événements rares, et qui, comparés à d'autres événements, ressemblent à des valeurs aberrantes qui ne devraient pas vraiment être là.
Par exemple, si vous mesurez les vitesses de toutes les voitures sur l'autoroute lorsqu'elles passent près de vous et que vous les tracez, vous verrez qu'elles sont généralement de l'ordre de, 50 mph à 70mph. Cependant, lorsque vous inspectez vos données pour votre patron, vous voyez que vous avez enregistré une vitesse de1,000,000mph. Non seulement cette valeur n'a pas de sens physique pour la vitesse d'une voiture réelle sur une autoroute, mais elle ressort également de manière extravagante du reste de vos données. Marquer cet événement jusqu'à une erreur de mesure étrange, vous le supprimez et donnez le reste de vos données à votre patron.
Cependant, alors que vous continuez vos mesures jour après jour, vous remarquez que de temps en temps, vous obtenez ces mesures folles de vitesse. Par exemple, sur une période d'une heure, vous mesurez 1 000 voitures et leur vitesse est bien comprise entre50 et 70 mph, mais 3 d'entre eux ont des vitesses de 23,424 mph, 12,000,121 mph, et 192,212,121,329,982,321,912 mph, violant non seulement les lois locales de l'État, mais aussi celles de la physique théorique.
Vous en avez assez de devoir continuellement entrer et de supprimer manuellement les points de données erronés causés par votre radar bon marché. Après tout, votre patron ne s'intéresse vraiment qu'aux statistiques des vitesses, pas tellement à chaque valeur réelle. Il aime faire de beaux histogrammes pour ses patrons.
Ces chiffres errants et importants sont une sorte de «bruit» que vous estimez - «bruit» causé par votre radar bon marché que vous avez acheté dans un magasin de prêteur sur gages ombragé. Le bruit est-il un bruit gaussien blanc additif? (AWGN). Oui et non - Son spectre est large bande et blanc, mais il est temporellement rare, clairsemé et très localisé. Il est mieux appelé bruit de «sel et poivre» (en particulier dans le domaine du traitement d'image).
Ainsi, ce que vous pouvez faire, c'est d'exécuter vos données via un filtre médian . Votre filtre médian prendra un bloc de dire,5points de vitesse (points 1 à 5), trouvez la médiane et crachez cette valeur comme vitesse «moyenne». Ensuite, il faudra les 5 points suivants (points 2 à 6), prendre cette médiane et cracher cela comme la moyenne, etc.
Que se passe-t-il lorsque vous rencontrez l'une de vos vitesses plus rapides que la lumière?. Disons que vos 5 vitesses étaient [45, 65, 50, 999999, 75]. Si vous avez pris la moyenne normale, votre vitesse "moyenne" ici sera quelque chose d'assez grand. Cependant, si vous prenez la médiane, votre «moyenne» sera de 65. Laquelle correspond le mieux à la moyenne que vous essayez vraiment de mesurer? La métrique médiane.
Ainsi, si vous filtrez vos données avec un filtre médian, vous serez sûr de supprimer ces valeurs aberrantes - et vous avez ainsi fidèlement «débruité» votre signal. En revanche, si vous avez essayé de supprimer votre bruit via le filtrage traditionnel (rien d'autre qu'une somme pondérée mobile), vous allez plutôt `` étaler '' l'erreur sur vos données et ne pas vous en débarrasser.
Mathématiques: Les mathématiques sont les suivantes: la mesure médiane est ce que l'on appelle une statistique d'ordre . Autrement dit, il renvoie la valeur de vos données, le long d'un certain point, après leur commande. Les valeurs max et min sont également des statistiques de commande - elles renvoient les points extrêmes de vos données après leur commande. Prendre la médiane renvoie également la valeur de vos données commandées, mais directement à partir du milieu.
Mais pourquoi sont-ils différents des filtres moyens? Eh bien, les filtres moyens calculent une moyenne en utilisant toutes les données. Si vous remarquez de max, min et médiane, vous obtenez une réponse sans utiliser toutes les données. En fait, tout ce que la médiane fait, c'est ordonner vos données et choisir la valeur au milieu. Il ne «touche» jamais les valeurs aberrantes, comme ces grandes vitesses que vous avez mesurées.
C'est pourquoi la médiane - une statistique d'ordre - est capable de «supprimer» le bruit aberrant pour vous. Le bruit aberrant se sépare devant la médiane, et la médiane ne s'en approche jamais ou ne la considère pas, tout en vous donnant une belle estimation de la tendance centrale.
En supposant des variables aléatoires indépendantes avec des distributions normales, la probabilité qu'une valeur tombe au-delà, disons, de 2 écarts-types sera d'environ 0,01.
Si vous avez un filtre médian de largeur 3, ce triplet doit contenir deux valeurs aberrantes du même côté de la moyenne pour qu'une valeur aberrante puisse passer. Cet événement a une probabilité de2⋅0.0052= 0,00005.
À mesure que le filtre médian augmente en largeur, la probabilité qu'une valeur aberrante le traverse diminue de façon exponentielle.
Réponses:
Intuition: L'intuition est la suivante: votre bruit est un événement ou des événements rares, et qui, comparés à d'autres événements, ressemblent à des valeurs aberrantes qui ne devraient pas vraiment être là.
Par exemple, si vous mesurez les vitesses de toutes les voitures sur l'autoroute lorsqu'elles passent près de vous et que vous les tracez, vous verrez qu'elles sont généralement de l'ordre de,50 mph à 70 mph. Cependant, lorsque vous inspectez vos données pour votre patron, vous voyez que vous avez enregistré une vitesse de1,000,000 mph. Non seulement cette valeur n'a pas de sens physique pour la vitesse d'une voiture réelle sur une autoroute, mais elle ressort également de manière extravagante du reste de vos données. Marquer cet événement jusqu'à une erreur de mesure étrange, vous le supprimez et donnez le reste de vos données à votre patron.
Cependant, alors que vous continuez vos mesures jour après jour, vous remarquez que de temps en temps, vous obtenez ces mesures folles de vitesse. Par exemple, sur une période d'une heure, vous mesurez 1 000 voitures et leur vitesse est bien comprise entre50 et 70 mph, mais 3 d'entre eux ont des vitesses de 23,424 mph, 12,000,121 mph, et 192,212,121,329,982,321,912 mph, violant non seulement les lois locales de l'État, mais aussi celles de la physique théorique.
Vous en avez assez de devoir continuellement entrer et de supprimer manuellement les points de données erronés causés par votre radar bon marché. Après tout, votre patron ne s'intéresse vraiment qu'aux statistiques des vitesses, pas tellement à chaque valeur réelle. Il aime faire de beaux histogrammes pour ses patrons.
Ces chiffres errants et importants sont une sorte de «bruit» que vous estimez - «bruit» causé par votre radar bon marché que vous avez acheté dans un magasin de prêteur sur gages ombragé. Le bruit est-il un bruit gaussien blanc additif? (AWGN). Oui et non - Son spectre est large bande et blanc, mais il est temporellement rare, clairsemé et très localisé. Il est mieux appelé bruit de «sel et poivre» (en particulier dans le domaine du traitement d'image).
Ainsi, ce que vous pouvez faire, c'est d'exécuter vos données via un filtre médian . Votre filtre médian prendra un bloc de dire,5 points de vitesse (points 1 à 5), trouvez la médiane et crachez cette valeur comme vitesse «moyenne». Ensuite, il faudra les 5 points suivants (points 2 à 6), prendre cette médiane et cracher cela comme la moyenne, etc.
Que se passe-t-il lorsque vous rencontrez l'une de vos vitesses plus rapides que la lumière?. Disons que vos 5 vitesses étaient [45, 65, 50, 999999, 75]. Si vous avez pris la moyenne normale, votre vitesse "moyenne" ici sera quelque chose d'assez grand. Cependant, si vous prenez la médiane, votre «moyenne» sera de 65. Laquelle correspond le mieux à la moyenne que vous essayez vraiment de mesurer? La métrique médiane.
Ainsi, si vous filtrez vos données avec un filtre médian, vous serez sûr de supprimer ces valeurs aberrantes - et vous avez ainsi fidèlement «débruité» votre signal. En revanche, si vous avez essayé de supprimer votre bruit via le filtrage traditionnel (rien d'autre qu'une somme pondérée mobile), vous allez plutôt `` étaler '' l'erreur sur vos données et ne pas vous en débarrasser.
Mathématiques: Les mathématiques sont les suivantes: la mesure médiane est ce que l'on appelle une statistique d'ordre . Autrement dit, il renvoie la valeur de vos données, le long d'un certain point, après leur commande. Les valeurs max et min sont également des statistiques de commande - elles renvoient les points extrêmes de vos données après leur commande. Prendre la médiane renvoie également la valeur de vos données commandées, mais directement à partir du milieu.
Mais pourquoi sont-ils différents des filtres moyens? Eh bien, les filtres moyens calculent une moyenne en utilisant toutes les données. Si vous remarquez de max, min et médiane, vous obtenez une réponse sans utiliser toutes les données. En fait, tout ce que la médiane fait, c'est ordonner vos données et choisir la valeur au milieu. Il ne «touche» jamais les valeurs aberrantes, comme ces grandes vitesses que vous avez mesurées.
C'est pourquoi la médiane - une statistique d'ordre - est capable de «supprimer» le bruit aberrant pour vous. Le bruit aberrant se sépare devant la médiane, et la médiane ne s'en approche jamais ou ne la considère pas, tout en vous donnant une belle estimation de la tendance centrale.
la source
En supposant des variables aléatoires indépendantes avec des distributions normales, la probabilité qu'une valeur tombe au-delà, disons, de 2 écarts-types sera d'environ 0,01.
Si vous avez un filtre médian de largeur 3, ce triplet doit contenir deux valeurs aberrantes du même côté de la moyenne pour qu'une valeur aberrante puisse passer. Cet événement a une probabilité de2⋅0.0052= 0,00005.
À mesure que le filtre médian augmente en largeur, la probabilité qu'une valeur aberrante le traverse diminue de façon exponentielle.
la source