Que signifie l'efficacité gaussienne?

10

Dans le cas d'estimateurs robustes, que signifie l'efficacité gaussienne ? Par exemple, a 82% d'efficacité gaussienne et 50% de point de rupture.Qn

La référence est: Rousseeuw PJ, et Croux, C. (1993). "Alternatives à la déviation absolue médiane." J. American Statistical Assoc., 88, 1273-1283

K-1
la source
veuillez ajouter plus de contexte. Référence où vous avez trouvé cela serait très utile.
mpiktas
8
Ma supposition : si l'échantillon suit une distribution gaussienne, alors l' efficacité relative asymptotique de l'estimateur robuste à 95%.
cardinal
la référence est: Rousseeuw PJ, et Croux, C. (1993). "Alternatives à la déviation absolue médiane." J. American Statistical Assoc., 88, 1273-1283.
K-1
3
@cardinal Votre interprétation est presque toujours celle qui est prévue, en particulier dans les discussions sur les estimateurs robustes. Je voudrais élever votre commentaire de «deviner» à «presque sûr».
whuber
2
@cardinal: votre commentaire est la bonne réponse. Veuillez le poster comme tel (je viens de voir cette question).
user603

Réponses:

-3

Je suppose que l'efficacité gaussienne est liée au coût de calcul.

L'efficacité de l'adaptation gaussienne repose sur la théorie de l'information due à Claude E. Shannon. Quand un événement se produit avec la probabilité P, alors le journal d'informations (P) peut être atteint. Par exemple, si la forme physique moyenne est P, les informations obtenues pour chaque individu sélectionné pour la survie seront −log (P) - en moyenne - et le travail / temps nécessaire pour obtenir les informations est proportionnel à 1 / P. Ainsi, si l'efficacité, E, est définie comme une information divisée par le travail / temps nécessaire pour l'obtenir, nous avons: E = −P log (P). Cette fonction atteint son maximum lorsque P = 1 / e = 0,37. Le même résultat a été obtenu par Gaines avec une méthode différente.

Je peux simplement conclure que plus l'efficacité gaussienne est élevée, moins de ressources (RAM) sont nécessaires pour calculer quelque chose comme un estimateur à l'échelle robuste d'un grand échantillon. Étant donné que les processeurs sont beaucoup plus rapides que le reste de l'ordinateur, nous préférons exécuter un algorithme d'essai / d'erreur pendant des périodes plutôt que de le faire en même temps avec 128 Go de RAM. lorsque l'efficacité gaussienne est élevée, le travail sera effectué dans un temps plus court.

K-1
la source
2
Cette interprétation est en quelque sorte sur la bonne voie, du moins au début. Je ne sais pas qui est Gaines ou comment il se rapporte à ce problème. Mais, voyez mon indice, qui vous fournit la réponse. Si nécessaire, je peux développer un peu. Je n'associerais certainement pas l'efficacité relative asymptotique aux ressources utilisées, comme vous avez essayé de le faire dans votre dernier paragraphe.
cardinal
@ Cardinal: Pourriez-vous s'il vous plaît expliquer plus sur l'efficacité gaussienne? Par exemple, quelle est la différence entre Qn qui bénéficie d'une efficacité gaussienne de 82% et MAD avec 37%? En fait, mon expérience est l'ingénierie côtière loin des statistiques!
K-1