Quelle est la différence entre les statistiques / méthodes sans distribution et les statistiques non paramétriques?

12

De Wikipédia

La première signification du terme non paramétrique couvre les techniques qui ne reposent pas sur des données appartenant à une distribution particulière. Il s'agit notamment:

  • les méthodes sans distribution, qui ne reposent pas sur des hypothèses selon lesquelles les données sont tirées d'une distribution de probabilité donnée. En tant que tel, c'est l'opposé des statistiques paramétriques. Il comprend des modèles statistiques non paramétriques, des inférences et des tests statistiques.
  • statistiques non paramétriques (dans le sens d'une statistique sur données, qui est définie comme étant une fonction sur un échantillon qui ne dépend pas d'un paramètre), dont l'interprétation ne dépend pas de la population ajustant les distributions paramétrées. Les statistiques basées sur les rangs des observations sont un exemple de telles statistiques et celles-ci jouent un rôle central dans de nombreuses approches non paramétriques.

Je ne vois pas la différence entre les deux cas: méthodes sans distribution et statistiques non paramétriques. Ne supposent-ils pas tous deux les données provenant d'une certaine distribution? En quoi diffèrent-ils?

Merci et salutations!

Tim
la source
1
La définition que vous citez suggère que la seconde est un sous-ensemble de la première, mais comme ils les ont en fait définis là (j'échangerais certaines parties de ces définitions avec l'autre terme!) - et généralement dans la pratique - elles semblent être utilisé de manière interchangeable. Non paramétrique dans ce sens signifie fondamentalement «paramétrique infini» tandis que les méthodes sans distribution sont celles dont l'implémentation et les propriétés comme les distributions nulles ne dépendent pas de la forme distributionnelle. Certains livres font une distinction entre les deux; si je pense à une référence, je reviendrai et l'ajouterai.
Glen_b -Reinstate Monica
@Glen_b: Merci! Quelques références seraient également appréciées!
Tim
@Glen_b: Pourquoi "le second est un sous-ensemble du premier"? Je ressens le contraire. Pourriez-vous me faire connaître quelques références? Merci!
Tim
«Cela inclut des modèles statistiques non paramétriques» est ce qui donne cette impression. Références sur les définitions des termes? Divers livres sur les statistiques sans distribution / non paramétriques tentent des définitions ou des distinctions; il y a longtemps que je n'ai pas lu un tas d'entre eux, mais des livres standard comme Conover, Bradley, Daniel, Marascuilo & McSweeney, Lindley seraient un début. Parmi ceux-ci, je serais enclin à vérifier d'abord Bradley. Je n'ai que Conover et Neave & Worthington à portée de main; Je n'ai pas repéré de définition non plus en quelques minutes de recherche - à ma grande surprise; Je pensais que les deux auraient quelque chose.
Glen_b -Reinstate Monica
@Glen_b: Merci! Pensez-vous que l'une des deux significations pour les statistiques non paramétriques dans la citation a quelque chose à voir avec les statistiques sans distribution?
Tim

Réponses:

5

Un exemple illustratif de la différence - comparer des échantillons de deux populations.

Avec la première définition, vous pouvez toujours comparer les moyennes des deux populations, en utilisant les échantillons pour tirer des conclusions (par exemple, en comparant les moyennes des échantillons). Les moyennes de population sont des paramètres, mais vous ne faites aucune hypothèse sur la distribution (par exemple, vous ne supposez pas que la population est normalement distribuée). Il s'agit donc de statistiques "sans distribution". Moi, je ne pense pas que cela devrait être appelé une partie des statistiques non paramétriques - en raison de la contradiction logique évidente.

Dans la deuxième définition, vous ne considérez pas du tout une moyenne de population ou tout autre paramètre. Au lieu de cela, vous utilisez des méthodes telles que des comparaisons de classements. Il s'agit de véritables statistiques non paramétriques.

Peter Ellis
la source
Merci! Dans les deux cas, les distributions de leurs statistiques ne dépendent-elles pas toutes les deux de la vraie distribution de l'échantillon?
Tim
Êtes-vous d'accord avec Glen_b que "le second est un sous-ensemble du premier"?
Tim
Tim, je ne pense pas que le second soit un sous-ensemble du premier; Veuillez relire mon commentaire et vous verrez que ce n'est pas du tout ce que j'ai dit. Je décrivais ce que la chose que vous avez citée semblait dire était le cas. Si je dis "On dirait que Bill pense X", cela n'implique pas "Glen_b pense X". Je ne pense peut-être rien de la sorte.
Glen_b -Reinstate Monica
1
Peu importe qui (le cas échéant) le pense, non, le deuxième cas n'est pas un sous-ensemble du premier. Le deuxième cas exclut explicitement l'intérêt pour les paramètres, qui sont au centre du premier.
Peter Ellis
@PeterEllis C'est un bon point
Glen_b -Reinstate Monica