Quelle est la valeur de p critique utilisée par la step()fonction dans R pour la régression pas à pas? Je suppose que c'est 0,15, mais mon hypothèse est-elle correcte? Comment puis-je changer la valeur de p
Quelle est la valeur de p critique utilisée par la step()fonction dans R pour la régression pas à pas? Je suppose que c'est 0,15, mais mon hypothèse est-elle correcte? Comment puis-je changer la valeur de p
J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1,...
Concernant la valeur de p de l'analyse de régression linéaire multiple, l'introduction du site Web de Minitab est présentée ci-dessous. La valeur de p pour chaque terme teste l'hypothèse nulle selon laquelle le coefficient est égal à zéro (aucun effet). Une valeur de p faible (<0,05) indique que...
J'essaie d'appliquer le test exact de Fisher dans un problème génétique simulé, mais les valeurs de p semblent être biaisées vers la droite. En tant que biologiste, je suppose qu'il me manque quelque chose d'évident pour chaque statisticien, donc j'apprécierais grandement votre aide. Ma...
J'apprends des tests de randomisation en ce moment. Deux questions me viennent à l'esprit: Oui, il est facile et intuitif de calculer la valeur de p avec le test de randomisation (qui, je pense, est le même que le test de permutation?). Cependant, comment pourrions-nous également générer un...
Dans les algorithmes de motif de réseau, il semble assez courant de renvoyer à la fois une valeur p et un score Z pour une statistique: "Le réseau d'entrée contient X copies du sous-graphique G". Un sous-graphique est considéré comme un motif s'il satisfait valeur p <A, Score Z> B et X> C,...
Je viens des sciences sociales, où p <0,05 est à peu près la norme, avec p <0,1 et p <0,01 également, mais je me demandais: quels domaines d'études, le cas échéant, utilisent des valeurs de p inférieures comme un commun la
Pourquoi les valeurs de p et les statistiques du test ks diminuent avec l'augmentation de la taille de l'échantillon? Prenez ce code Python comme exemple: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0,...
En utilisant Amelia dans R, j'ai obtenu plusieurs jeux de données imputés. Après cela, j'ai effectué un test de mesures répétées dans SPSS. Maintenant, je veux regrouper les résultats des tests. Je sais que je peux utiliser les règles de Rubin (implémentées via n'importe quel package d'imputation...
Il est bien connu qu'il est problématique de choisir un test statistique basé sur le résultat d'un autre test statistique, car les valeurs de p sont difficiles à impossibles à interpréter (par exemple choisir un test statistique basé sur le résultat d'un autre (par exemple la normalité) ) ....
Le test d'hypothèse s'apparente à un problème de classification. Disons que nous avons 2 étiquettes possibles pour une observation (sujet) - Coupable vs Non coupable. Que l'hypothèse non coupable soit nulle. Si nous considérions le problème du point de vue de la classification, nous formerions un...
J'essaie de comprendre le facteur Bayes (BF). Je crois qu'ils sont comme le rapport de vraisemblance de 2 hypothèses. Donc, si BF est 5, cela signifie que H1 est 5 fois plus probable que H0. Et une valeur de 3 à 10 indique des preuves modérées, tandis que> 10 indique des preuves solides....
En lisant le livre All of Statistics de Wassermann, je remarque une subtilité fine dans la définition des valeurs de p, que je ne peux pas comprendre. De manière informelle, le Wassermann définit la valeur de p comme [..] la probabilité (sous ) d'observer une valeur de la statistique de test...
Ma question est plutôt sémantique. Lorsqu'une méthode produit régulièrement des valeurs p élevées, elle est dite conservatrice. Diriez-vous l'inverse, c'est-à-dire une méthode avec un taux d'erreur élevé de type II
Le contexte C'est un peu similaire à cette question , mais je ne pense pas que ce soit un doublon exact. Lorsque vous recherchez des instructions sur la façon d'effectuer un test d'hypothèse de bootstrap, il est généralement indiqué qu'il est correct d'utiliser la distribution empirique pour les...
Je lis le livre de Larry Wasserman, All of Statistics , et actuellement sur les valeurs de p (page 187). Permettez-moi d'abord de présenter quelques définitions (je cite): Définition 1 La fonction de puissance d'un test avec une région de rejet est définie par La taille d'un test est définie comme...
Lors du test d'hypothèses nulles ou alternatives par une statistique de test , où , appliquez le test de permutation avec l'ensemble de permutations sur et nous avons une nouvelle statistique U(X)U(X)U(X)X={xi,...,xn}X={xi,...,xn}X = \{ x_i, ...,
J'ai récemment été initié aux corrections Hommel Hochberg. J'essaie de trouver une explication simple sur ce que c'est / fait réellement, mais je n'ai pas de chance. Quelqu'un peut-il donner une description brève et simple des corrections Hommel
Je teste l'indépendance dans une table de contingenceJe ne sais pas si le test G ou le test chi carré de Pearson est meilleur. La taille de l'échantillon est de l'ordre de centaines, mais le nombre de cellules est faible. Comme indiqué sur la page Wikipedia , l'approximation de la distribution du...
Je cherche une réponse qui satisferait un lecteur qui comprend les valeurs p fréquentistes mais ne comprend que les rudiments des approches bayésiennes des statistiques. À l'heure actuelle, les recherches Google ne révèlent aucune définition ni sur une page Wikipédia ni sur aucune autre ressource...