Introduction aux statistiques non paramétriques

11

J'étudie les statistiques depuis deux ans. Presque tout ce que j'ai appris concerne les statistiques paramétriques. J'aimerais maintenant en savoir plus sur les statistiques non paramétriques. Quelqu'un peut-il suggérer une introduction concise (peut-être aussi lisible) dans ce domaine?

LaTeXFan
la source

Réponses:

12

Cela dépend de ce que vous entendez par «concis», du type de traitement que vous recherchez (y compris mathématiques vs concepts et intuition), des techniques que vous souhaitez inclure.

Je suggère fortement de commencer par des livres et de lire plus d'un livre .

Les « statistiques pratiques non paramétriques » de Conover sont bonnes, et je préfèrerais certainement les inclure dans n'importe quelle liste.

Les « statistiques non paramétriques appliquées » de Daniel sont très bonnes, assez complètes pour sa taille.

J'ai trouvé les « tests sans distribution » de Neave et Worthington très lisibles quand il est sorti (et à bien des égards, il l'est toujours). De nos jours, le code qu'il contient semble quelque peu daté, mais d'un autre côté, il est généralement suffisamment lisible pour être traduit. Si vous pouvez le trouver, c'est une bonne introduction; un bon pour ramasser d'occasion si vous ne l'achetez pas neuf.

Il existe des dizaines de bons livres, certains plus anciens que les trois que j'ai mentionnés, d'autres plus récents; certains pourraient bien vous convenir mieux que tous ceux que j'ai mentionnés. Je commencerais par une bibliothèque universitaire et parcourrais les recherches avec des termes comme dans les titres ci-dessus, et si possible, je vois ce qui se trouve à proximité.

Lisez-en quelques-uns et trouvez-en plusieurs que vous aimez.

Quand j'ai fait des études non paramétriques en tant qu'étudiant de premier cycle, il y avait quelque chose comme huit livres dans la lecture recommandée, peut-être plus. Chacun d'eux avait quelque chose qui manquait à la plupart des autres. Je suis content de les avoir tous regardés.

Glen_b -Reinstate Monica
la source
4

Si votre domaine d'études est dans les sciences douces (par exemple, la psychologie, la sociologie, l'éducation), je recommanderais les statistiques non paramétriques pour les sciences du comportement par Siegel et Castellan (McGraw-Hill Book Company). (J'ai la deuxième édition de 1988). De la préface:

Une caractéristique distinctive [est] le schéma détaillé de l'application de chaque procédure aux données réelles.

Joel Reyes Noche
la source
2

J'ai trouvé «Régression semi-paramétrique» par Carroll, Wand et al. être tout à fait lisible. Il est dépassé, mais c'est une bonne chose de commencer avant de passer au livre concis mais dense de Simon Wood sur les GAM.

Ces deux livres se concentrent sur les modèles de régression spline pénalisés, ce qui n'est pas tout dans les statistiques non paramétriques. Mais sans doute le plus utile pour les personnes appliquées.

utilisateur_générique
la source
1
FOui(y)E(Oui)=g(X)
droite. juste curieux, quels sont des exemples de cas dans le travail appliqué où la première des deux formes de travail non paramétrique pourrait être utile? ou je suppose que le bootstrap serait un exemple, non?
generic_user
1
ACD, je vous recommande de jeter un œil à l'un des livres mentionnés dans mes réponses. Je peux citer - littéralement - plusieurs milliers d'articles qui les appliquent à de vrais problèmes, notamment les tests de Wilcoxon-Mann-Whitney, les tests de qualité de l'ajustement comme le Kolmogorov-Smirnov, les mesures de corrélation comme le Kendall et Spearman, la régression de Theil-Sen , Courbes de survie de Kaplan-Meier (et tests de log-rank), permutation / randomisation (+ autres méthodes de rééchantillonnage) et bien d'autres choses de ce genre. Dans l'ensemble, je dirais que cela peut être appliqué un peu plus souvent que le sens que vous l'utilisez. Oui, le bootstrap est inclus.
Glen_b -Reinstate Monica
1
(ctd) ... la zone est assez grande; si vous le réduisez un peu, je peux probablement vous trouver des applications particulières.
Glen_b -Reinstate Monica
1
C'est vrai, donc ses tests ne reposent généralement pas sur des hypothèses de distribution. Je suppose que je me demande si l'on peut estimer une distribution non paramétrique pour un modèle en même temps que l'estimation des relations entre les variables (probablement avec beaucoup de données). Mais, comme vous le faites remarquer, il y a beaucoup à lire.
generic_user
2

J'ai été surpris de ne pas voir toutes les statistiques non paramétriques de Larry Wasserman mentionnées.

Je pense que c'est un grand livre de taille relativement concise. Surtout si quelqu'un a déjà des connaissances en statistique paramétrique, ce livre offre un regard très nouveau sur " les méthodes statistiques qui visent à maintenir le nombre d'hypothèses sous-jacentes aussi faible que possible ". Je l'ai trouvé moins verbeux que les autres livres d'introduction / introduction; cela peut être une bonne ou une mauvaise chose selon ses préférences. Le seul "delta" de ce livre est qu'il ne couvre pas vraiment les tests de classement.

usεr11852
la source
(+1) Il semble que le livre de Wasserman "Toutes les statistiques" contienne également un traitement, quoique plus court, des statistiques non paramétriques. Ces deux livres, ainsi que de nombreux autres, sont agréables, mais à mon humble avis une surpuissance pour les chercheurs / scientifiques appliqués dans une certaine mesure. Bien sûr, cela ne fera pas de mal de connaître tous les théorèmes et les preuves, mais c'est un "bien à avoir" plutôt qu'un "must have", compte tenu des limites de temps et de portée. Je n'ai pas encore trouvé de livres statistiques équilibrés pour les scientifiques appliqués (c'est-à-dire assez rigoureux sans entrer dans les détails et aussi utiles du point de vue de l'application).
Aleksandr Blekh