Questions marquées «rule-of-thumb»

Conseils sur les analyses statistiques qui sont souvent utiles dans la pratique (mais qui ne sont pas toujours garanties de fonctionner).

85
Règles empiriques pour les statistiques «modernes»

J'aime le livre de G van Belle sur les règles statistiques statistiques , et dans une moindre mesure, les erreurs communes en statistique (et comment les éviter) de Phillip I Good et James W. Hardin. Ils traitent des pièges courants lors de l'interprétation des résultats d'études expérimentales et...

80
Calculer le nombre optimal de bacs dans un histogramme

Je suis intéressé à trouver une méthode optimale pour déterminer le nombre de casiers à utiliser dans un histogramme. Mes données devraient aller de 30 à 350 objets au maximum, et en particulier j'essaie d'appliquer un seuillage (comme la méthode d'Otsu) où les "bons" objets, pour lesquels je...

43
Quelles références faut-il citer pour soutenir l’utilisation de 30 échantillons de taille suffisante?

J'ai lu / entendu à plusieurs reprises que la taille d'échantillon d'au moins 30 unités est considérée comme un "échantillon large" (les hypothèses de normalité des moyennes sont généralement à peu près valables en raison du CLT, ...). Par conséquent, dans mes expériences, je génère généralement...

22
Bonne ressource en ligne avec des conseils sur l'association graphique entre deux variables numériques dans diverses conditions

Le contexte: Au fil du temps, j'ai acquis un ensemble d'heuristiques sur la façon de tracer efficacement l'association entre deux variables numériques. J'imagine que la plupart des gens qui travaillent avec des données auraient un ensemble de règles similaire. Des exemples de telles règles peuvent...

21
Comment projeter un nouveau vecteur sur l'espace PCA?

Après avoir effectué l'analyse des composants principaux (PCA), je souhaite projeter un nouveau vecteur sur l'espace PCA (c'est-à-dire trouver ses coordonnées dans le système de coordonnées PCA). J'ai calculé PCA en langage R en utilisant prcomp. Maintenant, je devrais pouvoir multiplier mon...

14
ou

Quelqu'un utilise-t-il les métriques L1L1L_1 ou L.5L.5L_.5 pour le clustering, plutôt que L2L2L_2 ? Aggarwal et al., A propos du comportement surprenant des mesures de distance dans un espace de grande dimension, a déclaré (en 2001) que L1L1L_1 est toujours plus préférable que la métrique de...

8
Règles simples de base pour les statistiques

Dans une expérience binomiale, si nous observons individu positif parmi individus, alors la proportion d'individus positifs est significativement inférieure à avec une erreur de type 1 inférieure et très proche de . Ce fait, parfois appelé "règle des trois", est une conséquence des...