Dans le cas d'estimateurs robustes, que signifie l'efficacité gaussienne ? Par exemple, a 82% d'efficacité gaussienne et 50% de point de rupture.
La référence est: Rousseeuw PJ, et Croux, C. (1993). "Alternatives à la déviation absolue médiane." J. American Statistical Assoc., 88, 1273-1283
Réponses:
Je suppose que l'efficacité gaussienne est liée au coût de calcul.
L'efficacité de l'adaptation gaussienne repose sur la théorie de l'information due à Claude E. Shannon. Quand un événement se produit avec la probabilité P, alors le journal d'informations (P) peut être atteint. Par exemple, si la forme physique moyenne est P, les informations obtenues pour chaque individu sélectionné pour la survie seront −log (P) - en moyenne - et le travail / temps nécessaire pour obtenir les informations est proportionnel à 1 / P. Ainsi, si l'efficacité, E, est définie comme une information divisée par le travail / temps nécessaire pour l'obtenir, nous avons: E = −P log (P). Cette fonction atteint son maximum lorsque P = 1 / e = 0,37. Le même résultat a été obtenu par Gaines avec une méthode différente.
Je peux simplement conclure que plus l'efficacité gaussienne est élevée, moins de ressources (RAM) sont nécessaires pour calculer quelque chose comme un estimateur à l'échelle robuste d'un grand échantillon. Étant donné que les processeurs sont beaucoup plus rapides que le reste de l'ordinateur, nous préférons exécuter un algorithme d'essai / d'erreur pendant des périodes plutôt que de le faire en même temps avec 128 Go de RAM. lorsque l'efficacité gaussienne est élevée, le travail sera effectué dans un temps plus court.
la source