Étant donné uniquement les observations d'un signal binaire perturbé par le bruit gaussien avec des informations préalables inconnues, comment puis-je estimer le seuil de décision optimal?
(Non, ce n'est pas une question de devoirs)
Plus précisément, je pense au modèle suivant: est un état à deux Variable aléatoire :
avec des paramètres inconnus :.
Le seuil de vraisemblance maximale a posteriori pourrait être calculé à partir de ces paramètres si je les connaissais. Je pensais à l'origine à la façon d'estimer les paramètres en premier afin d'atteindre le seuil. Mais je pense qu'il peut être plus robuste d'estimer directement.
Réflexions: Normaliser les observations (soustraire la moyenne de l'échantillon et diviser par l'écart-type) réduit l'espace des paramètres en 2 dimensions: et .
la source
Réponses:
Mon intuition est qu'il serait difficile de déterminer le bon seuil de décision que vous vous attendez à trouver:
A partir des statistiques globales que vous envisagez (moyenne d'échantillon:πμ0+(1−π)μ1 ; écart type: expression plus complexe mais je doute que cela impliquerait un log).
J'aborderais le problème de cette façon:
Si l'hypothèse queσ est petit peut être fait
Je le mentionne, car gardez à l'esprit que le seuil de décision est affecté parπ seulement si σ est suffisamment élevé pour permettre aux deux classes de se chevaucher. Si laμ s sont éloignés de plus de quelques-uns σ , les probabilités a priori de classe n'ont rien à dire dans le processus de décision!
Si aucune hypothèseσ peut être fait
la source
Pour résumer, vous avez deux distributions avec des paramètres inconnus et une mesure qui peut provenir de l'un ou l'autre processus stochastique. Ceci est généralement désigné comme un problème d'association de données et il est très courant et largement étudié au sein de la communauté de suivi. Vous pourriez envisager d'utiliser un filtre d'association de données de probabilité (PDAF) ou un algorithme de suivi multi-hypothèses (MHT). Cela devrait vous fournir des estimations de la moyenne et de la variance pour chaque distribution.
Alternativement, puisque votre bruit est blanc et gaussien, les ML, MAP et MMSE sont tous équivalents et peuvent être trouvés en minimisant l'erreur quadratique moyenne (fonction de coût), comme cela est effectivement décrit par la réponse précédente. J'utiliserais une approche de programmation dynamique pour trouver le minimum de la fonction de coût. Cela devrait être moins complexe (sur le plan informatique) que les méthodes EM / clustering décrites précédemment. Encore un commentaire: le PDAF est récursif. Étant donné le modèle de signal simple, il devrait fonctionner très efficacement et à ce que j'attends, c'est une fraction de la complexité de calcul de l'algorithme EM. Bonne chance, -B
la source
Il existe un algorithme du milieu des années 1980 de Kittler et Illingworth appelé «Minimum Error Thresholding» qui résout ce problème pour les distributions gaussiennes. Récemment, Mike Titterington (Université de Glasgow) et JH Xue (maintenant à l'UCL) ont mis cela dans un cadre statistique plus formel, voir leurs publications de revues conjointes.
la source