L'indépendance statistique dans le monde réel

8

J'ai lu l'article suivant sur l'indépendance statistique . En résumé, l'article soutient que "Il est temps que la science retire la fiction de l'indépendance statistique" et poursuit en expliquant différentes raisons. Après avoir lu l'article, j'ai tendance à être d'accord. Je voulais savoir ce qui suit:

  1. Que pensent les autres utilisateurs à validation croisée?
  2. Existe-t-il des ressources savantes sur lesquelles vous pouvez tous me diriger pour confirmer ou rejeter la notion énoncée dans l'article? Plus précisément, si les ensembles de données réels présentent (ou non) une indépendance statistique?

Merci!

Kiran K.
la source
13
Je pense que nous ne sommes pas aussi naïfs et mal informés que "la pratique courante écrasante" à laquelle l'auteur fait référence. Il y a beaucoup de fausses hypothèses, des hommes de paille et des affirmations carrément incorrectes dans ce petit morceau.
whuber
3
Je suppose que l'auteur de cet article n'a jamais essayé de retourner des pièces avant ....
RustyStatistician
1
Sa plainte semble être que parfois, les gens utilisent le mauvais modèle et appliquent de manière inappropriée l'hypothèse d'indépendance. C'est certainement plausible ... mais l'indépendance existe en tant que concept non pas au service de la science mais parce qu'elle se pose mathématiquement. C'est presque comme si l'auteur prétend qu'il n'y a pas de rôle pour les mathématiques qui pourraient être mal utilisées dans les applications scientifiques.
Sycorax dit Réintégrer Monica le

Réponses:

5

Il me semble que l'auteur suppose que la plupart des scientifiques ne savent pas ou ne savent pas comment gérer la corrélation et suppose presque que l'utilisation de méthodes pour gérer les données corrélées n'existe pas (peut-être en dehors de Makov Chains). Ce n'est pas le cas. Il existe de nombreuses méthodes statistiques qui tiennent compte des données corrélées et la plupart des statisticiens, épidémiologistes, écologistes et autres scientifiques savent (ou devraient) quand utiliser les méthodes appropriées. Je ne pense pas que les scientifiques doivent abandonner les méthodes qui supposent l'indépendance car elles sont très utiles - s'il ne s'agissait pas de simulations et d'expériences réelles qui ont démontré leur utilité ne seraient pas abondantes. Au lieu de cela, si quelque chose,

C'est juste mes deux cents.

StatsStudent
la source
3

Je ne partage pas du tout l'avis de l'auteur. D'après mon expérience en particulier, il n'est absolument pas vrai que "[...] la pratique courante écrasante consiste simplement à supposer que les événements échantillonnés sont indépendants". Au contraire, la question de la corrélation est quelque chose que nous devons traiter régulièrement (lors de mon travail dans le secteur financier). Et, surtout, nous en sommes clairement conscients!

Je suis totalement d'accord, cependant, avec les déclarations sur la simplification du monde réel. Pour moi, les mots célèbres attribués à George Box sont le principal guide ici:

Tous les modèles ont tort; certains modèles sont utiles.

Dr_Be
la source
Merci de nous rappeler ces fameux mots de George Box, je pense que c'est très vrai et pertinent ici.
Kiran K.
0

Bien sûr, la notion d'indépendance statistique telle qu'elle a été prêchée jusqu'à présent, est à peu près un mythe (la plupart). Je ne pense pas que quiconque devrait être en désaccord sur le fait que l'univers et tout ce qu'il contient fonctionne en conjonction avec tout le reste.

En fait, en ce qui concerne l'indépendance statistique, ce n'est que dans les ensembles de données ou en quelque sorte, elle existe en termes très spécifiques. Mais en général, la dépendance fait partie intégrante de l'univers.

Shiv_90
la source
1
Oui, mais une grande partie est négligeable en termes de nos outils de mesure.
StatsStudent
1
Exactement. C'est peut-être pour cela que nous traitons ces variables comme indépendantes car leur dépendance est négligeable.
Shiv_90