Résumé des résultats «Grand p, Petit n»

20

Quelqu'un peut-il m'indiquer un document d'enquête sur les résultats "Grand , Petit n "? Je suis intéressé par la façon dont ce problème se manifeste dans différents contextes de recherche, par exemple la régression, la classification, le test de Hotelling, etc .pn

shabbychef
la source

Réponses:

12

Je ne connais pas un seul article, mais je pense que le livre actuel avec le meilleur aperçu des méthodes applicables à est toujours Friedman-Hastie-Tibshirani. Il est très partiel au rétrécissement et au lasso (je sais d'une connaissance commune que Vapnik a été contrarié lors de la première édition du livre), mais couvre presque toutes les méthodes de rétrécissement courantes et montre leur lien avec Boosting. Parlant de Boosting, l' enquête de Buhlmann & Hothorn montre également le lien avec le retrait.pn

Mon impression est que, bien que la classification et la régression puissent être analysées en utilisant le même cadre théorique, les tests de données de grande dimension sont différents, car ils ne sont pas utilisés conjointement avec les procédures de sélection des modèles, mais se concentrent plutôt sur les taux d'erreur par famille. Pas si sûr des meilleures enquêtes là-bas. Brad Efron a une tonne d'articles / sondages / livre sur sa page . Lisez-les tous et faites-moi savoir celui que je devrais vraiment lire ...

gappy
la source
4

Qu'entendez-vous par résultat théorique "résultat"? ou des résultats numériques?

J'aime les avis de Jianqing Fan voir par exemple celui-ci et celui-ci sur la classification (beaucoup de citations personnelles).

Il y a aussi des articles non révisés qui font un examen riche en introduction, voir par exemple celui-ci et celui-ci .

Robin Girard
la source
0

Le chapitre 18 de Hastie, Tibshirani et Friedman (12e impression / deuxième édition, ce chapitre n'était pas dans la première édition) est un bon aperçu avec quelques ensembles de données intéressants. Ce n'est pas aussi complet que leur traitement de matériel plus ancien, et la plupart du temps, ils doivent donner des explications quelque peu heuristiques pour expliquer pourquoi certains algorithmes fonctionnent mieux que d'autres. Je l'ai trouvé très utile, couplé à la lecture d'articles pour des choses que vous voulez savoir plus en profondeur.

Sheridan Grant
la source