Je viens des sciences sociales, où p <0,05 est à peu près la norme, avec p <0,1 et p <0,01 également, mais je me demandais: quels domaines d'études, le cas échéant, utilisent des valeurs de p inférieures comme un commun la
Je viens des sciences sociales, où p <0,05 est à peu près la norme, avec p <0,1 et p <0,01 également, mais je me demandais: quels domaines d'études, le cas échéant, utilisent des valeurs de p inférieures comme un commun la
Que signifie pour une étude être surchargée? Mon impression est que cela signifie que la taille de vos échantillons est si grande que vous avez le pouvoir de détecter de minuscules tailles d'effet. Ces tailles d'effet sont peut-être si petites qu'elles sont plus susceptibles de résulter de légers...
J'ai le nombre total d'appels reçus chaque semaine et les ai tracés sur un graphique, remontant à près de 3 ans. À l'œil nu, il semble qu'il y ait eu une baisse massive de Noël, qui ne semble pas avoir récupéré, il semble qu'il y ait eu un changement radical dans les demandes. Existe-t-il un test...
Je lis Gelman & Carlin "Au-delà des calculs de puissance: évaluation des erreurs de type S (signe) et de type M (amplitude)" (2014). J'essaie de comprendre l'idée principale, la voie principale, mais je suis confus. Quelqu'un pourrait-il m'aider à distiller l'essence? Le papier va quelque chose...
Lorsque j'analyse mes variables dans deux modèles de régression logistique distincts (univariés), j'obtiens ce qui suit: Predictor 1: B= 1.049, SE=.352, Exp(B)=2.85, 95% CI=(1.43, 5.69), p=.003 Constant: B=-0.434, SE=.217, Exp(B)=0.65, p=.046 Predictor 2: B= 1.379, SE=.386, Exp(B)=3.97, 95%...
Supposons que nous ayons l'ensemble de données suivant: Men Women Dieting 10 30 Non-dieting 5 60 Si je lance le test exact de Fisher dans R, qu'est-ce que cela alternative = greaterimplique (ou moins)? Par exemple: mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") Je reçois...
Si quelqu'un fait une déclaration comme ci-dessous: "Dans l'ensemble, les non-fumeurs exposés à la fumée ambiante avaient un risque relatif de maladie coronarienne de 1,25 (intervalle de confiance à 95%, 1,17 à 1,32) par rapport aux non-fumeurs non exposés à la fumée." Quel est le risque relatif...
Contexte: J'ai dû effectuer une analyse de données pour un client (une sorte d'avocat) qui était un débutant absolu en statistique. Il m'a demandé ce que le terme "signification statistique" signifie et j'ai vraiment essayé de l'expliquer ... mais comme je ne suis pas bon pour expliquer les choses,...
J'ai utilisé la méthode d'extraction de réseau fédérateur décrite dans cet article: http://www.pnas.org/content/106/16/6483.abstract Fondamentalement, les auteurs proposent une méthode basée sur des statistiques qui produit une probabilité, pour chaque bord du graphique, que le bord aurait pu...
Avertissement: si vous trouvez que cette question est trop similaire à une autre, je suis heureux qu'elle soit fusionnée. Cependant, je n'ai pas trouvé de réponse satisfaisante ailleurs (et je n'ai pas encore la "réputation" de commenter ou de voter), donc j'ai pensé qu'il serait préférable de...
Un webinaire organisé l'autre jour par une société de test a / b a demandé à son "Data Scientist" résident d'expliquer que vous devriez valider vos résultats en réexécutant l'expérience. La prémisse était que, si vous sélectionnez une confiance de 95%, il y a 5% (1/20) de risque de faux positif. Si...
Ma question est plutôt sémantique. Lorsqu'une méthode produit régulièrement des valeurs p élevées, elle est dite conservatrice. Diriez-vous l'inverse, c'est-à-dire une méthode avec un taux d'erreur élevé de type II
Dans PCA, les valeurs propres déterminent l'ordre des composants. Dans ICA, j'utilise kurtosis pour obtenir la commande. Quelles sont les méthodes acceptées pour évaluer le nombre (étant donné que j'ai la commande) de composants qui sont singuliers en dehors des connaissances préalables sur le...
J'ai calculé une matrice de corrélation d'un ensemble de données qui contient 455 points de données, chaque point de données contenant 14 caractéristiques. La dimension de la matrice de corrélation est donc de 14 x 14. Je me demandais s'il existe un seuil pour la valeur du coefficient de...
J'ai un prototype de machine qui produit des pièces. Dans un premier test, la machine produit pièces et un classificateur binaire me dit que pièces sont défectueuses ( , généralement et ) et que les pièces sont bonnes.N1N1N_1d 1 < N 1 d 1 / N 1 < 0,01 N 1 ≈ 10 4 N 1 - d 1ré1ré1d_1ré1<...
Je travaille sur la prédiction de séries chronologiques. J'ai deux ensembles de données et . J'ai trois modèles de prédiction: . Tous ces modèles sont entraînés à l'aide d'échantillons dans l'ensemble de données , et leurs performances sont mesurées à l'aide des échantillons dans l'ensemble de...
Quelle est la bonne façon de tester la signification des ratios de Sharpe ou des ratios d'information? Les ratios de Sharpe seront basés sur divers indices boursiers et peuvent avoir des périodes de rétrospective variables. Une solution que j'ai vue décrite applique simplement un test t de Student,...
En utilisant le bootstrap, je calcule les valeurs de p des tests de signification en utilisant deux méthodes: rééchantillonnage sous l'hypothèse nulle et comptage des résultats au moins aussi extrêmes que le résultat provenant des données originales rééchantillonnage sous l'hypothèse alternative et...
J'ai deux échantillons de données, un échantillon de référence et un échantillon de traitement. L'hypothèse est que l'échantillon de traitement a une moyenne plus élevée que l'échantillon de référence. Les deux échantillons ont une forme exponentielle. Étant donné que les données sont assez...
Dès le titre je voudrais savoir s'il existe un test statistique qui peut m'aider à identifier une divergence significative entre deux séries chronologiques similaires. Plus précisément, en regardant la figure ci-dessous, je voudrais détecter que les séries commencent à diverger à l'instant t1,...