Je suis en train de parcourir un document qui utilise l'inégalité oracle pour prouver quelque chose mais je suis incapable de comprendre ce qu'il essaie même de faire. Lorsque j'ai recherché en ligne «Oracle Inequality», certaines sources m'ont dirigé vers l'article «Candes, Emmanuel J. "qui peut être trouvé ici https://statweb.stanford.edu/~candes/papers/NonlinearEstimation.pdf . Mais ce livre me semble trop lourd et je pense qu'il me manque quelques prérequis.
Ma question est la suivante: comment expliqueriez-vous ce qu'est une inégalité Oracle à un majeur non mathématique (inclut les ingénieurs)? Deuxièmement, comment recommanderiez-vous qu'ils abordent les conditions préalables / sujets avant d'essayer d'apprendre quelque chose comme le livre mentionné ci-dessus.
Je recommanderais fortement à quelqu'un qui a une compréhension concrète et une bonne expérience des statistiques de grande dimension de répondre à cette question.
Réponses:
Je vais essayer de l'expliquer en cas linéaire. Considérons le modèle linéaire Lorsque (nombre de variables indépendantes inférieures ou égales au nombre d'observations) et que la matrice de conception a un rang complet, l'estimateur le moins carré de est et l'erreur de prédiction est dont on peut déduire Cela signifie que chaque paramètre est estimé avec une précision au carréAinsi, votre précision globale au carré est
Et si le nombre d'observations est inférieur au nombre de variables indépendantes ? Nous «croyons» que toutes nos variables indépendantes ne jouent pas un rôle dans l'explication de , donc seules quelques-unes, disons , sont non nulles. Si nous savions quelles variables sont non nulles, nous pourrions négliger toutes les autres variables et par l'argument ci-dessus, la précision quadratique globale serait(p>n) Y k (σ2/n)k.
Parce que l'ensemble des variables non nulles est inconnu, nous avons besoin d'une pénalité de régularisation (par exemple ) avec le paramètre de régularisation (qui contrôle le nombre de variables). Maintenant, vous voulez obtenir des résultats similaires à ceux mentionnés ci-dessus, vous voulez estimer la précision au carré. Le problème est que votre estimateur optimal dépend maintenant de . Mais le grand fait est qu'avec un choix approprié pour vous pouvez obtenir une limite supérieure d'erreur de prédiction avec une probabilité élevée, c'est-à-dire "l'inégalité oracle" Notez un facteur supplémentairel1 λ β^ λ λ
la source