Le rétrécissement de James-Stein «à l'état sauvage»?

15

Je suis pris par l'idée du rétrécissement de James-Stein (c'est-à-dire qu'une fonction non linéaire d'une observation unique d'un vecteur de normales éventuellement indépendantes peut être un meilleur estimateur des moyennes des variables aléatoires, où «mieux» est mesuré par erreur quadratique ). Cependant, je ne l'ai jamais vu dans le travail appliqué. De toute évidence, je ne suis pas assez bien lu. Existe-t-il des exemples classiques de cas où James-Stein a amélioré l'estimation dans un cadre appliqué? Sinon, ce type de rétrécissement n'est-il qu'une curiosité intellectuelle?

shabbychef
la source

Réponses:

13

L'estimateur de James-Stein n'est pas largement utilisé mais il a inspiré le seuillage doux, le seuillage dur qui est vraiment très utilisé.

L'estimation du retrait des ondelettes (voir le paquet R wavethresh) est beaucoup utilisée dans le traitement du signal, le centroïde rétréci (paquet pamr sous R) pour la classification est utilisé pour les microréseaux d'ADN, il existe de nombreux exemples d'efficacité pratique du retrait ...

À des fins théoriques, voir la section de la revue de Candes sur l'estimation du retrait (p20-> James Stein et la section après celle-ci traite du seuillage doux et dur):

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.161.8881&rep=rep1&type=pdf

EDIT des commentaires: pourquoi le retrait JS est-il moins utilisé que Soft / hard Thresh?

James Stein est plus difficile à manipuler (pratiquement et théoriquement) et à comprendre intuitivement que le seuillage dur mais la question pourquoi est une bonne question!

Robin Girard
la source
Je suppose que je me demande pourquoi l'estimateur de James-Stein n'est pas largement utilisé. Est-il englobé par ces autres techniques ou les conditions du théorème ne sont-elles pas réunies dans la pratique?
shabbychef
selon l'article, je cite James stein et les seuils doux / dur satisfont les inégalités d'oracle. Je suppose que James Stein est plus difficile à manipuler pour comprendre intuitivement que le seuillage difficile, mais la question de savoir pourquoi est une bonne question!
Robin Girard
13

La régression de crête est une forme de rétrécissement. Voir Draper et Van Nostrand (1979) .

Le retrait s'est également révélé utile pour estimer les facteurs saisonniers des séries chronologiques. Voir Miller et Williams (IJF, 2003) .

Rob Hyndman
la source
+1 pour cet article! ma référence pour le lien entre seuillage et estimation pénalisée était google.fr/…
robin girard
11

Comme mentionné par d'autres, James-Stein n'est pas souvent utilisé directement, mais c'est vraiment le premier document sur le retrait, qui à son tour est utilisé à peu près partout dans la régression simple et multiple. Le lien entre James-Stein et l'estimation moderne est expliqué en détail dans cet article par E.Candes. Pour en revenir à votre question, je pense que James-Stein est une non-curiosité intellectuelle, dans le sens où il était certainement intellectuel, mais a eu un effet incroyablement perturbateur sur les statistiques, et personne ne pourrait le rejeter comme curiosité par la suite. Tout le monde pensait que les moyens empiriques étaient un estimateur admissible, et Stein leur a donné tort avec un contre-exemple. Le reste appartient à l'histoire.

gappy
la source
5

Korbinian Strimmer utilise l'estimateur de James-Stein pour inférer des réseaux de gènes . J'ai utilisé ses packages R à quelques reprises et il semble fournir une réponse très bonne et rapide.

csgillespie
la source
J'aime son article de 2008 sur le FDR. Je n'utilise pas R, cependant :(
shabbychef