De Wikipédia
La première signification du terme non paramétrique couvre les techniques qui ne reposent pas sur des données appartenant à une distribution particulière. Il s'agit notamment:
- les méthodes sans distribution, qui ne reposent pas sur des hypothèses selon lesquelles les données sont tirées d'une distribution de probabilité donnée. En tant que tel, c'est l'opposé des statistiques paramétriques. Il comprend des modèles statistiques non paramétriques, des inférences et des tests statistiques.
- statistiques non paramétriques (dans le sens d'une statistique sur données, qui est définie comme étant une fonction sur un échantillon qui ne dépend pas d'un paramètre), dont l'interprétation ne dépend pas de la population ajustant les distributions paramétrées. Les statistiques basées sur les rangs des observations sont un exemple de telles statistiques et celles-ci jouent un rôle central dans de nombreuses approches non paramétriques.
Je ne vois pas la différence entre les deux cas: méthodes sans distribution et statistiques non paramétriques. Ne supposent-ils pas tous deux les données provenant d'une certaine distribution? En quoi diffèrent-ils?
Merci et salutations!
Réponses:
Un exemple illustratif de la différence - comparer des échantillons de deux populations.
Avec la première définition, vous pouvez toujours comparer les moyennes des deux populations, en utilisant les échantillons pour tirer des conclusions (par exemple, en comparant les moyennes des échantillons). Les moyennes de population sont des paramètres, mais vous ne faites aucune hypothèse sur la distribution (par exemple, vous ne supposez pas que la population est normalement distribuée). Il s'agit donc de statistiques "sans distribution". Moi, je ne pense pas que cela devrait être appelé une partie des statistiques non paramétriques - en raison de la contradiction logique évidente.
Dans la deuxième définition, vous ne considérez pas du tout une moyenne de population ou tout autre paramètre. Au lieu de cela, vous utilisez des méthodes telles que des comparaisons de classements. Il s'agit de véritables statistiques non paramétriques.
la source