J'ai lu l'article suivant sur l'indépendance statistique . En résumé, l'article soutient que "Il est temps que la science retire la fiction de l'indépendance statistique" et poursuit en expliquant différentes raisons. Après avoir lu l'article, j'ai tendance à être d'accord. Je voulais savoir ce qui suit:
- Que pensent les autres utilisateurs à validation croisée?
- Existe-t-il des ressources savantes sur lesquelles vous pouvez tous me diriger pour confirmer ou rejeter la notion énoncée dans l'article? Plus précisément, si les ensembles de données réels présentent (ou non) une indépendance statistique?
Merci!
modeling
independence
Kiran K.
la source
la source
Réponses:
Il me semble que l'auteur suppose que la plupart des scientifiques ne savent pas ou ne savent pas comment gérer la corrélation et suppose presque que l'utilisation de méthodes pour gérer les données corrélées n'existe pas (peut-être en dehors de Makov Chains). Ce n'est pas le cas. Il existe de nombreuses méthodes statistiques qui tiennent compte des données corrélées et la plupart des statisticiens, épidémiologistes, écologistes et autres scientifiques savent (ou devraient) quand utiliser les méthodes appropriées. Je ne pense pas que les scientifiques doivent abandonner les méthodes qui supposent l'indépendance car elles sont très utiles - s'il ne s'agissait pas de simulations et d'expériences réelles qui ont démontré leur utilité ne seraient pas abondantes. Au lieu de cela, si quelque chose,
C'est juste mes deux cents.
la source
Je ne partage pas du tout l'avis de l'auteur. D'après mon expérience en particulier, il n'est absolument pas vrai que "[...] la pratique courante écrasante consiste simplement à supposer que les événements échantillonnés sont indépendants". Au contraire, la question de la corrélation est quelque chose que nous devons traiter régulièrement (lors de mon travail dans le secteur financier). Et, surtout, nous en sommes clairement conscients!
Je suis totalement d'accord, cependant, avec les déclarations sur la simplification du monde réel. Pour moi, les mots célèbres attribués à George Box sont le principal guide ici:
la source
Bien sûr, la notion d'indépendance statistique telle qu'elle a été prêchée jusqu'à présent, est à peu près un mythe (la plupart). Je ne pense pas que quiconque devrait être en désaccord sur le fait que l'univers et tout ce qu'il contient fonctionne en conjonction avec tout le reste.
En fait, en ce qui concerne l'indépendance statistique, ce n'est que dans les ensembles de données ou en quelque sorte, elle existe en termes très spécifiques. Mais en général, la dépendance fait partie intégrante de l'univers.
la source