Que fait exactement un test non paramétrique et que faites-vous des résultats?

22

J'ai l'impression que cela a peut-être été demandé ailleurs, mais pas vraiment avec le type de description de base dont j'ai besoin. Je sais que non paramétrique s'appuie sur la médiane au lieu de la moyenne pour comparer ... quelque chose. Je crois également qu'il repose sur des "degrés de liberté" (?) Au lieu de l'écart-type. Corrigez-moi si je me trompe.

J'ai fait de très bonnes recherches, ou du moins je pensais, en essayant de comprendre le concept, quels en sont les mécanismes, ce que signifient réellement les résultats des tests et / ou quoi faire des résultats des tests; cependant, personne ne semble jamais s'aventurer dans ce domaine.

Par souci de simplicité, gardons-nous du test U de Mann-Whitney, que j'ai remarqué est assez populaire (et aussi apparemment mal utilisé et trop utilisé afin de forcer son "modèle carré dans un trou circulaire"). Si vous souhaitez également décrire les autres tests, n'hésitez pas, bien que je me sente une fois que j'en comprends un, je peux comprendre les autres de manière analogue vers divers tests t, etc.

Supposons que j'exécute un test non paramétrique avec mes données et que j'obtiens ce résultat:

2 Sample Mann-Whitney - Customer Type       

Test Information        
H0: Median Difference = 0       
Ha: Median Difference ≠ 0       

Size of Customer    Large   Small
Count                    45    55
Median                    2     2

Mann-Whitney Statistic: 2162.00 
p-value (2-sided, adjusted for ties):   0.4156  

Je connais d'autres méthodes, mais qu'est-ce qui est différent ici? Devrions-nous vouloir que la valeur p soit inférieure à 0,05? Que signifie la "statistique de Mann-Whitney"? Y a-t-il une utilité? Est-ce que ces informations ici vérifient ou non qu'une source de données particulière que je possède doit ou ne doit pas être utilisée?

J'ai une quantité raisonnable d'expérience avec la régression et les bases, mais je suis très curieux à propos de ce truc non paramétrique "spécial" - qui je sais aura ses propres défauts.

Imaginez simplement que je suis élève de cinquième année et voyez si vous pouvez me l'expliquer.

Taal
la source
4
Oui, je l'ai lu plusieurs fois. Parfois, le jargon utilisé par wikipedia peut devenir écrasant et bien qu'il ait une description précise - il n'a pas nécessairement une description claire pour quelqu'un qui commence à essayer d'apprendre la région. Je ne sais pas qui a voté contre, mais je veux légitimement juste une explication de base, CLAIRE, que presque tout le monde pourrait comprendre. Oui, j'ai beaucoup essayé d'en trouver un, croyez-le ou non. Pas besoin de me voter instantanément et de me lier à wikipedia. Quelqu'un a-t-il déjà remarqué à quel point certains enseignants sont meilleurs que d'autres? Je cherche un bon "professeur" pour un concept sur lequel je suis coincé.
Taal
1
Passez ensuite à un bon texte de statistiques de base non paramétriques comme Sprent et Smeeton, Hollander et Wolfe, Conover. ou trouvez un texte d'introduction qui comprend Mann-Whitney.
Nick Cox
1
En regardant votre question et l'autre question que vous avez posée récemment, utiliser Internet seul ne fonctionne pas bien pour vous, car vous êtes évidemment très confus. C'est pourquoi @Peter Flom et moi recommandons des livres. Je n'ai pas d'autres suggestions en réserve. Je recommanderais également - sincèrement et dans votre intérêt - d'essayer d'écrire des questions beaucoup plus concises et moins bavardes. Votre style dégressif n'aide pas à clarifier vos questions.
Nick Cox
1
Internet, à lui seul, fonctionne mieux que n'importe quel livre ou cours pour que je sois honnête - et cela vaut pour n'importe quel sujet. Je m'excuse d'avoir écrit des questions "bavardes".
Taal
3
Non, il ne semble pas fonctionner aussi bien qu'un bon livre. Pour paraphraser Stephen Senn, il est étrange que les statistiques soient la seule science que les gens exigent pour être compréhensible à première vue.
Frank Harrell

Réponses:

41

Je sais que non paramétrique s'appuie sur la médiane au lieu de la moyenne

Pratiquement aucun test non paramétrique "ne repose" sur des médianes dans ce sens. Je ne peux penser qu'à un couple ... et le seul dont je pense que vous auriez probablement entendu parler serait le test des signes.

comparer ... quelque chose.

S'ils s'appuyaient sur des médianes, ce serait probablement pour comparer les médianes. Mais - malgré ce que plusieurs sources essaient de vous dire - des tests comme le test de classement signé, ou le Wilcoxon-Mann-Whitney ou le Kruskal-Wallis ne sont pas du tout un test des médianes; si vous faites des hypothèses supplémentaires, vous pouvez considérer le Wilcoxon-Mann-Whitney et le Kruskal-Wallis comme des tests de médianes, mais selon les mêmes hypothèses (tant que les moyens de distribution existent), vous pouvez également les considérer comme un test de moyens .

L'estimation de localisation réelle pertinente pour le test du rang signé est la médiane des moyennes par paire au sein de l'échantillon, celle de Wilcoxon-Mann-Whitney (et par implication, dans Kruskal-Wallis) est la médiane des différences par paire entre les échantillons .

Je crois aussi que cela repose sur des "degrés de liberté?" au lieu de l'écart-type. Corrigez-moi si je me trompe.

La plupart des tests non paramétriques n'ont pas de `` degrés de liberté '', bien que la distribution de beaucoup change avec la taille de l'échantillon et vous pourriez considérer cela comme quelque peu apparenté aux degrés de liberté dans le sens où les tableaux changent avec la taille de l'échantillon. Les échantillons conservent bien sûr leurs propriétés et ont n degrés de liberté dans ce sens, mais les degrés de liberté dans la distribution d'une statistique de test ne nous concernent généralement pas. Il peut arriver que vous ayez quelque chose de plus comme des degrés de liberté - par exemple, vous pourriez certainement faire valoir que le Kruskal-Wallis a effectivement des degrés de liberté dans le même sens qu'un khi carré, mais il n'est généralement pas examiné de cette façon (par exemple, si quelqu'un parle des degrés de liberté d'un Kruskal-Wallis, ils signifieront presque toujours le df

Une bonne discussion des degrés de liberté peut être trouvée ici /

J'ai fait de très bonnes recherches, c'est du moins ce que j'ai pensé, en essayant de comprendre le concept, ce que le fonctionnement est derrière, ce que les résultats des tests signifient vraiment, et / ou quoi faire même avec les résultats des tests; cependant, personne ne semble jamais s'aventurer dans ce domaine.

Je ne sais pas ce que tu veux dire par là.

Je pourrais suggérer quelques livres, comme Conover's Practical Nonparametric Statistics , et si vous pouvez l'obtenir, le livre de Neave et Worthington ( Distribution-Free Tests ), mais il y en a beaucoup d'autres - Marascuilo & McSweeney, Hollander & Wolfe, ou le livre de Daniel par exemple. Je vous suggère de lire au moins 3 ou 4 de ceux qui vous parlent le mieux, de préférence ceux qui expliquent les choses aussi différemment que possible (cela signifierait au moins lire un peu de peut-être 6 ou 7 livres pour trouver disons 3 qui conviennent).

Par souci de simplicité, respectons le test de Mann Whitney U, que j'ai remarqué comme très populaire

C'est ce qui m'a intrigué dans votre déclaration "personne ne semble jamais s'aventurer dans ce domaine" - de nombreuses personnes qui utilisent ces tests "s'aventurent dans le domaine" dont vous parliez.

- et aussi apparemment mal utilisé et surutilisé

Je dirais que les tests non paramétriques sont généralement sous - utilisés si quelque chose (y compris les tests de Wilcoxon-Mann-Whitney) - plus particulièrement les tests de permutation / randomisation, bien que je ne contesterais pas nécessairement qu'ils sont fréquemment mal utilisés (mais les tests paramétriques le sont aussi, même d'autant plus).

Supposons que j'exécute un test non paramétrique avec mes données et que j'obtiens ce résultat:

[couper]

Je connais d'autres méthodes, mais qu'est-ce qui est différent ici?

De quelles autres méthodes parlez-vous? À quoi voulez-vous que je compare cela?

Edit: Vous mentionnez la régression plus tard; Je suppose donc que vous connaissez un test t à deux échantillons (car c'est vraiment un cas particulier de régression).

Selon les hypothèses du test t ordinaire à deux échantillons, l'hypothèse nulle veut que les deux populations soient identiques, contre l'alternative selon laquelle l'une des distributions a changé. Si vous regardez le premier des deux ensembles d'hypothèses pour le Wilcoxon-Mann-Whitney ci-dessous, la chose de base testée est presque identique; c'est juste que le test t est basé sur l'hypothèse que les échantillons proviennent de distributions normales identiques (en dehors d'un éventuel changement de lieu). Si l'hypothèse nulle est vraie et que les hypothèses qui l'accompagnent sont vraies, la statistique de test a une distribution t. Si l'hypothèse alternative est vraie, alors la statistique de test devient plus susceptible de prendre des valeurs qui ne semblent pas cohérentes avec l'hypothèse nulle mais semblent cohérentes avec l'alternative - nous nous concentrons sur la plus inhabituelle,

La situation est très similaire avec celle de Wilcoxon-Mann-Whitney, mais elle mesure l'écart de la valeur nulle quelque peu différemment. En fait, lorsque les hypothèses du test t sont vraies *, c'est presque aussi bon que le meilleur test possible (qui est le test t).

* (ce qui n'est jamais le cas en pratique, bien que ce ne soit pas vraiment autant un problème qu'il y paraît)

wmw sous null et alternatif

En effet, il est possible de considérer le Wilcoxon-Mann-Whitney comme un "test t" efficace effectué sur les rangs des données - bien qu'il n'ait alors pas de distribution t; la statistique est une fonction monotone d'une statistique t à deux échantillons calculée sur les rangs des données, donc elle induit le même ordre ** sur l'espace d'échantillonnage (c'est-à-dire un "test t" sur les rangs - correctement exécuté - générerait les mêmes valeurs de p qu'un Wilcoxon-Mann-Whitney), il rejette donc exactement les mêmes cas.

** (strictement, commande partielle, mais laissons cela de côté)

[On pourrait penser que le simple fait d'utiliser les rangs jetterait beaucoup d'informations, mais lorsque les données sont tirées de populations normales avec la même variance, presque toutes les informations sur le changement de lieu se trouvent dans les schémas des rangs. Les valeurs réelles des données (conditionnelles à leur classement) ajoutent très peu d'informations supplémentaires à cela. Si vous allez plus lourd que la normale, il ne faut pas longtemps avant que le test de Wilcoxon-Mann-Whitney ait un meilleur pouvoir, tout en conservant son niveau de signification nominal, de sorte que les informations supplémentaires au-dessus des rangs finissent par devenir non seulement non informatives, mais dans certains sens, trompeur. Cependant, la queue lourde presque symétrique est une situation rare; ce que vous voyez souvent dans la pratique, c'est l'asymétrie.]

Les idées de base sont assez similaires, les valeurs p ont la même interprétation (la probabilité d'un résultat, ou plus extrême, si l'hypothèse nulle était vraie) - jusqu'à l'interprétation d'un changement de lieu, si vous faites les hypothèses requises (voir la discussion des hypothèses vers la fin de ce post).

Si je faisais la même simulation que dans les graphiques ci-dessus pour le test t, les graphiques sembleraient très similaires - l'échelle sur les axes x et y serait différente, mais l'apparence de base serait similaire.

Devrions-nous vouloir que la valeur p soit inférieure à 0,05?

Vous ne devriez pas "vouloir" quoi que ce soit là-bas. L'idée est de savoir si les échantillons sont plus différents (dans un sens géographique) que ce qui peut être expliqué par hasard, et non de «souhaiter» un résultat particulier.

Si je dis « Peux - tu aller voir la couleur de la voiture de Raj est s'il vous plaît? », Si je veux une évaluation impartiale de ce que je ne veux pas que tu sois allez « Mec, je vraiment, espérons vraiment que c'est bleu! Il juste doit être bleu". Mieux vaut simplement voir quelle est la situation, plutôt que d'aller avec certains «j'ai besoin que ce soit quelque chose».

Si le niveau de signification choisi est 0,05, vous rejetterez l'hypothèse nulle lorsque la valeur p est inférieure à 0,05. Mais ne pas rejeter lorsque vous avez une taille d'échantillon suffisamment grande pour détecter presque toujours les tailles d'effet pertinentes est au moins aussi intéressant, car cela dit que toutes les différences qui existent sont petites.

Que signifie le numéro "mann whitley"?

La statistique de Mann-Whitney .

Cela n'a vraiment de sens que par rapport à la distribution des valeurs qu'il peut prendre lorsque l'hypothèse nulle est vraie (voir le diagramme ci-dessus), et cela dépend de la définition de plusieurs programmes particuliers qu'un programme particulier pourrait utiliser.

Y a-t-il une utilité?

Habituellement, vous ne vous souciez pas de la valeur exacte en tant que telle, mais où elle se trouve dans la distribution nulle (que ce soit plus ou moins typique des valeurs que vous devriez voir lorsque l'hypothèse nulle est vraie, ou si elle est plus extrême)

(Modifier: vous pouvez obtenir ou calculer des quantités directement informatives lors d'un tel test - comme le décalage d'emplacement ou discuté ci-dessous, et en effet, vous pouvez calculer le second assez directement à partir de la statistique, mais le la statistique seule n'est pas un nombre très informatif)P(X<Oui)

Est-ce que ces données ici vérifient simplement ou non qu'une source de données particulière que je possède devrait ou ne devrait pas être utilisée?

Ce test ne dit rien sur "une source particulière de données que je dois ou ne devrait pas être utilisée".

Voir ma discussion sur les deux façons d'examiner les hypothèses WMW ci-dessous.

J'ai une quantité raisonnable d'expérience avec la régression et les bases, mais je suis très curieux à propos de ce truc non paramétrique "spécial"

Les tests non paramétriques n'ont rien de particulièrement spécial (je dirais que les tests `` standard '' sont à bien des égards encore plus fondamentaux que les tests paramétriques typiques) - tant que vous comprenez réellement les tests d'hypothèse.

C'est probablement un sujet pour une autre question, cependant.


Il existe deux façons principales d'examiner le test d'hypothèse de Wilcoxon-Mann-Whitney.

i) L'une consiste à dire «je m'intéresse au changement de lieu - c'est-à-dire que sous l'hypothèse nulle, les deux populations ont la même distribution (continue) , contre l'alternative selon laquelle l'une est« décalée »vers le haut ou vers le bas par rapport à la autre"

Le Wilcoxon-Mann-Whitney fonctionne très bien si vous faites cette hypothèse (que votre alternative n'est qu'un changement de lieu)

Dans ce cas, le Wilcoxon-Mann-Whitney est en fait un test pour les médianes ... mais c'est également un test pour les moyennes, ou en fait toute autre statistique équivariante à l'emplacement (90e centiles, par exemple, ou moyennes ajustées, ou n'importe quel nombre de d'autres choses), car ils sont tous affectés de la même manière par le changement d'emplacement.

La bonne chose à ce sujet est qu'il est très facilement interprétable - et il est facile de générer un intervalle de confiance pour ce changement d'emplacement.

changement d'emplacement

Cependant, le test de Wilcoxon-Mann-Whitney est sensible à d'autres types de différence qu'un changement d'emplacement.

ii) L'autre consiste à adopter une approche entièrement générale. Vous pouvez caractériser cela comme un test pour la probabilité qu'une valeur aléatoire de la population 1 soit inférieure à une valeur aléatoire de la population 2 (et en effet, vous pouvez transformer votre statistique de Wilcoxon-Mann-Whitney en une estimation directe de cette probabilité, si vous sont tellement enclins; la formulation de Mann & Whitney en termes de statistiques U compte le nombre de fois où l'une dépasse l'autre dans les échantillons, vous n'avez besoin que d'une échelle pour obtenir une estimation de la probabilité); la valeur nulle est que la probabilité de population est , contre l'alternative qu'elle diffère de .1212

décalage de P (X <Y) de 1/2

Glen_b -Reinstate Monica
la source
J'ai dessiné la distribution nulle approximative (celle en rouge dans le nouveau graphique le plus haut) comme si elle était continue ... mais la distribution réelle est discrète. L'image est moins encombrée de cette façon.
Glen_b -Reinstate Monica
3
+1 Excellente réponse. Une des explications les meilleures et les plus accessibles du test de Wilcoxon-Mann-Whitney que je connaisse. Merci.
COOLSerdash
"Dans ce cas, le Wilcoxon-Mann-Whitney est en fait un test pour les médianes ... mais c'est aussi un test pour les moyens" Cependant, certaines distributions n'ont pas de moyens alors que leur médiane est bien définie (par exemple Cauchy).
caracal
@caracal Bien que cela soit vrai (c'est un point que j'ai souligné à plusieurs reprises ici), si quelqu'un teste l'égalité de la population signifie, il est probable qu'ils supposent déjà que les moyennes de la population sont finies. S'ils ne le font pas, ils ont un problème bien avant d'arriver au point de choisir un test. Étant donné qu'il existe une hypothèse de moyens de population égaux (et donc finis), selon les mêmes hypothèses qui sont généralement utilisées pour en faire un test des médianes (alternatives de décalage), le WMW est également un test des moyens.
Glen_b -Reinstate Monica
17

Supposons que vous et moi entraînions des équipes d'athlétisme. Nos athlètes viennent de la même école, ont des âges similaires et le même sexe (c'est-à-dire qu'ils sont issus de la même population), mais je prétends avoir découvert un nouveau système d'entraînement révolutionnaire qui permettra aux membres de mon équipe de courir beaucoup plus vite que le tiens. Comment puis-je vous convaincre que cela fonctionne vraiment?

Nous avons une course.

Ensuite, je m'assois et calcule le temps moyen pour les membres de mon équipe et le temps moyen pour les membres de la vôtre. Je revendiquerai la victoire si le temps moyen pour mes athlètes est non seulement plus rapide que le temps moyen pour le vôtre, mais la différence est également grande par rapport à la "dispersion", ou écart-type, de nos résultats.


t


"Mais Matt", vous plaignez-vous, "ce n'est pas tout à fait juste. Nos équipes sont assez similaires, mais vous - par pure chance - vous êtes retrouvé avec le coureur le plus rapide du district. Il n'est pas dans la même ligue que tout le monde" sinon, il est pratiquement un monstre de la nature. Il a terminé 3 minutes avant le deuxième plus rapide, ce qui réduit beaucoup votre temps moyen, mais les autres concurrents sont assez homogènes. Regardons plutôt l'ordre d'arrivée. Si votre méthode fonctionne vraiment, les finisseurs précédents devraient principalement être de votre équipe, mais si ce n'est pas le cas, l'ordre d'arrivée devrait être assez aléatoire. Cela ne donne pas un poids indu à votre super-star! "


t

p

ttt

Matt Krause
la source
En fait, vous avez répondu à ma question exactement de la façon dont je veux dire exactement de la façon dont je voulais qu'elle soit répondue. Glen a également progressé du côté mathématique, et la combinaison de ces deux réponses a fait le déclic pour moi. Je ne peux pas lui retirer la récompense - je veux dire ... il dessine des graphiques, malgré la clarté de votre réponse. J'ai l'impression que vous avez eu une sorte d'enseignant dans le passé. Je sais qu'il peut y avoir quelques généralisations dans les réponses ici, mais je savais que je n'avais pas à acheter un livre et à l'étudier intensément pour commencer à pouvoir appliquer pratiquement la non paramétrique à un certain niveau
Taal
t
L'ironie de tout cela est que je ne vais probablement pas l'utiliser du tout, cela m'a juste dérangé de ne pas pouvoir obtenir une réponse claire sur ce que c'était. La réponse de Glen est bien plus que ce à quoi je m'attendais et que j'ai obtenu à l'origine - les meilleures réponses que je ne peux pas décrire car aucune description ne se révélerait inadéquate. Comme dire à quelqu'un à quoi ressemble la couleur bleue. Si vous avez lu des trucs de whuber, il semble que vous ayez une saveur similaire ...
Taal
6

Vous avez demandé à être corrigé en cas d'erreur. Voici quelques commentaires sous cette rubrique pour compléter les suggestions positives de @Peter Flom.

  • "non paramétrique s'appuie sur la médiane au lieu de la moyenne": souvent en pratique, mais ce n'est pas une définition. Plusieurs tests non paramétriques (par exemple le khi carré) n'ont rien à voir avec les médianes.

  • repose sur des degrés de liberté au lieu de l'écart-type; c'est très confus. L'idée de degrés de liberté n'est en aucun cas une alternative à l'écart type; degrés de liberté en tant qu'idée s'applique à travers les statistiques.

  • "une source particulière de données dont je dispose devrait ou ne devrait pas être utilisée": cette question n'a rien à voir avec le test de signification que vous avez appliqué, qui concerne à peu près la différence entre des sous-ensembles de données et est exprimé en termes de différence entre les médianes.

Nick Cox
la source
Je crois que votre avis sur moi demandant "d'être corrigé là où c'est mal" a été la meilleure réponse jusqu'à présent. Je suppose que j'avais besoin de quelques hypothèses nulles réfutées ou d'apprendre par processus d'élimination. Votre réponse m'a donné de nouvelles informations que je comprends - il y a encore de gros trous dans ma compréhension du sujet, mais je ne peux pas m'attendre à la perfection. Peut-être que ces trous sont plus grands que ce à quoi je m'attendais à l'origine lors de l'écriture de cette question et stackexchange ne suffirait pas, peu importe comment "bavard" j'ai fait la question.
Taal
4

Vous "voulez" les mêmes choses d'une valeur de p ici que vous voulez dans n'importe quel autre test.

La statistique U est le résultat d'un calcul, tout comme la statistique t, le rapport de cotes, la statistique F ou ce que vous avez. La formule peut être trouvée beaucoup d'endroits. Ce n'est pas très intuitif, mais alors, les autres statistiques de test ne le sont pas non plus tant que vous ne vous y êtes pas habitué (nous reconnaissons à 2 comme étant dans la plage significative parce que nous les voyons tout le temps).

Le reste de la sortie dans votre texte de bloc doit être clair.

Pour une introduction plus générale aux tests non paramétriques, je fais écho à @NickCox .... obtenez un bon livre. Non paramétrique signifie simplement «sans paramètres»; il existe de nombreux tests et statistiques non paramétriques à des fins très diverses.

Peter Flom - Réintégrer Monica
la source
Oui, idéalement, un bon livre aiderait; Cependant, cela semble inutile avec les ressources d'aujourd'hui (comme stackexchange), wikipedia (parfois), la concurrence sur le marché youtube (saviez-vous que pour chaque million de vues, quelqu'un reçoit un salaire de 4000 $?), ainsi qu'une variété d'autres ressources. En général, tout comme mon style d'apprentissage, j'échoue aussi très bien à l'apprentissage d'un livre simple.
Taal
1
J'apprécie votre message, mais il réitère en fait déjà la plupart de ce que je sais déjà ou que j'avais supposé malheureusement. Il semble y avoir une sorte de schéma où presque toutes les explications que j'obtiens s'arrêtent à ce point spécifique. Peut-être que ce point est où cela devient trop complexe à expliquer ou trop d'efforts - je ne suis pas sûr. Quoi qu'il en soit, c'est un modèle que j'ai vécu de toutes les sources d'informations que j'utilise normalement - qui réitérerait ironiquement la déclaration du livre de tout le monde. Peut-être que je ne savais pas que la réponse était si complexe; là encore, j'ai vu une réponse intense sur SE.
Taal
2
Vous nous demandez d'abord de simplifier, puis vous vous plaignez que nos réponses sont simples! Si vous voulez comprendre la formule pour U (ou autre chose) REGARDEZ-LA. Si vous voulez quelque chose de simple, ne demandez pas de complexité! L'entrée Wikipedia est une excellente entrée détaillée avec tous les détails. Tu ne le comprends pas. Alors. Qu'est-ce que vous voulez?
Peter Flom - Réintègre Monica
1
Je suppose quelque part entre les deux. Certes, je ne suis pas le meilleur à communiquer, et je peux comprendre que vous soyez frustré, hein. C'est un de mes traits dont je suis vraiment conscient. Pour être honnête, je pense que je devrai réfléchir à ce que je veux vraiment - car c'est presque comme si j'essayais de pousser la question suffisamment pour qu'elle se chevauche dans un domaine que je ne connaissais pas ou que je ne connaissais pas auparavant à propos. Il est difficile de poser des questions sur quelque chose que vous ne comprenez pas en général. Je vais juste devoir y revenir, je suppose.
Taal
1

En réponse à une question récemment close , cela répond également à ce qui précède. Vous trouverez ci-dessous une citation des tests statistiques sans distribution classiques de Bradley (1968, p. 15-16) qui, bien qu'un peu longue, est une explication assez claire, je crois.

Les termes non paramétrique et sans distribution ne sont pas synonymes, et aucun des deux termes ne donne une description entièrement satisfaisante de la classe de statistiques à laquelle ils sont destinés. En gros, un test non paramétrique est un test qui ne fait aucune hypothèse sur la valeur d'un paramètre dans une fonction de densité statistique, alors qu'un test sans distribution est un test qui ne fait aucune hypothèse sur la forme précise de la population échantillonnée. Les définitions ne s'excluent pas mutuellement et un test peut être à la fois sans distribution et paramétrique.… Pour être parfaitement clair sur ce que l'on entend par sans distribution, il est nécessaire de distinguer trois distributions: (a) celle de la population échantillonnée; b) celle de la caractéristique d'observation effectivement utilisée par l'essai; et c) celle de la statistique de test. La distribution dont les tests sont "gratuits" est celle de (a), la population échantillonnée. Et la liberté dont ils jouissent est généralement relative… Mais les hypothèses ne sont jamais assez élaborées pour impliquer une population dont la distribution est complètement spécifiée… La raison… est très simple: les grandeurs ne sont pas utilisées telles quelles dans le test [non paramétrique], il n'y a pas d'autre attribut de population fortement lié de la variable. Au lieu il n'y a pas d'autre attribut de population fortement lié de la variable. Au lieu il n'y a pas d'autre attribut de population fortement lié de la variable. Au lieuéchantillon lié en charachteristics des observations obtenues ... fournir le informatikon utilisé par la statistique de test. ... Ainsi , alors que les tests paramétriques et non paramétriques exigent que la forme f une répartition, associée à des observations, soit pleinement connue, que la connaissance, dans le cas paramétrique, n'est généralement pas à venir et la distribution requise des grandeurs doit donc être "supposée" ou déduite sur la base d'informations approximatives ou incomplètes. Dans le cas non paramétrique, d'autre part et, la distribution de la caractéristique d' observationest généralement connu précisément à partir de considérations a priori et n'a donc pas besoin d'être "supposé". La différence n'est donc pas liée à l'exigence mais plutôt à ce qui est requis et à la certitude que l'exigence sera satisfaite.

Avraham
la source