À la page 180 de Statistiques robustes: l'approche basée sur les fonctions d'influence, on trouve la question suivante:
- 16: Montrer que pour les estimateurs invariants de localisation toujours . Trouvez la borne supérieure correspondante sur le point de rupture de l'échantillon fini , à la fois dans le cas où est impair ou est pair.
La deuxième partie (après la période) est en fait triviale (étant donné la première) mais je ne trouve pas de moyen de prouver la première partie (phrase) de la question.
Dans la section du livre relative à cette question, on trouve (p98):
Définition 2: Le point de rupture d'échantillon fini d'un estimateur à l'échantillon est donné par:
où l'échantillon est obtenu en remplaçant points de données par des valeurs arbitraires
La définition formelle de elle-même s'étend sur presque une page, mais peut être considérée comme Bien qu'elle ne soit pas définie explicitement, une peut deviner que l'emplacement-invariant signifie que doit satisfaire
Je (essaie de) répondre à la question de whuber dans le commentaire ci-dessous. Le livre définit l'estimateur fait plusieurs pages, à partir de la p82, j'essaie de reproduire les parties principales (je pense qu'il répondra à la question de whuber):
Supposons que nous ayons des observations unidimensionnelles qui sont indépendantes et identiquement distribuées (iid). Les observations appartiennent à un espace échantillon , qui est un sous-ensemble de la ligne réelle (souvent simplement égal à lui-même, donc les observations peuvent prendre n'importe quelle valeur ). Un modèle paramétrique consiste en une famille de distributions de probabilités , sur l'espace échantillon, où le paramètre inconnu appartient à un espace paramétrique
...
Nous identifions l'échantillon avec sa distribution empirique , en ignorant la séquence des observations (comme cela se fait presque toujours). Formellement, , est donnée par où , est la masse du point 1 dans . En tant qu'estimateurs de , nous considérons les statistiques à valeur réelle . Dans un sens plus large, un estimateur peut être considéré comme une séquence de statistiques , une pour chaque taille d'échantillon possible . Idéalement, les observations sont iid selon un membre du modèle paramétrique , mais la classe de toutes les distributions de probabilités possibles sur est beaucoup plus grande.
Nous considérons des estimateurs qui sont fonctionnels [c'est-à-dire pour tout et ] ou qui peuvent être remplacés asymptotiquement par des fonctionnels. Cela signifie que nous supposons qu'il existe un fonctionnel [où le domaine de est l'ensemble de toutes les distributions pour laquelle est défini] tel que en probabilité lorsque les observations sont iid selon la vraie distribution dans . On dit que
est la valeur asymptotique de à .
...
Dans ce chapitre, nous supposons toujours que les fonctionnelles étudiées sont cohérentes avec Fisher (Kallianpur et Rao, 1955): ce qui signifie qu'à le modèle l'estimateur mesure asymptotiquement la bonne quantité. La notion de cohérence de Fisher est plus appropriée et élégante pour les fonctionnelles que la cohérence habituelle ou l'impartialité asymptotique.
la source
Réponses:
Les livres de statistiques plus anciens utilisaient «invariant» d'une manière légèrement différente de ce à quoi on pourrait s'attendre; la terminologie ambiguë persiste. Un équivalent plus moderne est «équivariant» (voir les références à la fin de cet article). Dans le contexte actuel, cela signifie
pour tous les vrais .c
Pour répondre à la question, supposons alors que ait la propriété que pour suffisamment grand , tout réel et tout ,Tn n c m≤ε∗n
chaque fois que diffère de par au plus en au plus coordonnées.Y X c m
(Il s'agit d'une condition plus faible que celle supposée dans la définition de la limite de ventilation. En fait, tout ce que nous devons vraiment supposer est que lorsque est suffisamment grand, l'expression " " est une valeur garantie d'être inférieure à en taille.)n o(|c|) |c|/2
La preuve est par contradiction. Supposons, en conséquence, que ce est également équivariant et supposons . Alors pour suffisamment grand , est un entier pour lequel et . Pour tout nombre réel définirTn ε∗>1/2 n m(n)=⌊ε∗n⌋ m(n)/n≤ε∗ (n−m(n))/n≤ε∗ a,b
où il y a et . En changeant ou moins des coordonnées, nous concluons à la foism(n) a n−m(n) b m(n)
et
Pour l'inégalité du triangle affirmec>0
L'inégalité stricte sur l'avant-dernière ligne est assurée pour suffisamment grand . La contradiction qu'elle implique, , prouven c<c ε∗≤1/2.
Références
EL Lehmann, Théorie de l'estimation ponctuelle . John Wiley 1983.
Dans le texte (chapitre 3, section 1) et une note de bas de page Lehmann écrit
la source