Il est habituel d'utiliser les deuxième, troisième et quatrième moments d'une distribution pour décrire certaines propriétés. Les moments partiels ou les moments supérieurs au quatrième décrivent-ils des propriétés utiles d'une
Il est habituel d'utiliser les deuxième, troisième et quatrième moments d'une distribution pour décrire certaines propriétés. Les moments partiels ou les moments supérieurs au quatrième décrivent-ils des propriétés utiles d'une
Cette question concerne l'estimation des scores de coupure sur un questionnaire de dépistage multidimensionnel pour prédire un critère d'évaluation binaire, en présence d'échelles corrélées. On m'a interrogé sur l'intérêt de contrôler les sous-scores associés lors de l'élaboration des scores de...
Verrouillé . Cette question et ses réponses sont verrouillées car la question est hors sujet mais a une signification historique. Il n'accepte pas actuellement de nouvelles réponses ou interactions. Python matplotlib a une commande boxplot . Normalement, toutes les parties du graphique sont...
Je souhaite apprendre (et implémenter) une alternative à l'interpolation polynomiale. Cependant, j'ai du mal à trouver une bonne description de la façon dont ces méthodes fonctionnent, comment elles sont liées et comment elles se comparent. J'apprécierais votre contribution sur les avantages /...
Disons que nous avons deux facteurs (A et B), chacun avec deux niveaux (A1, A2 et B1, B2) et une variable de réponse (y). Lorsque vous effectuez une ANOVA bidirectionnelle du type: y~A+B+A*B Nous testons trois hypothèses nulles: Il n'y a pas de différence dans les moyennes du facteur A Il n'y a pas...
Je travaille sur la création d'un site Web, qui affiche les données du recensement pour un utilisateur de polygones sélectionnés et souhaite afficher graphiquement la distribution des différents paramètres (un graphique par paramètre). Les données ont généralement les propriétés suivantes: La...
Je ne sais pas trop comment décider de traiter le temps comme continu ou discret dans l'analyse de survie. Plus précisément, je veux utiliser l'analyse de survie pour identifier les variables au niveau de l'enfant et du ménage qui ont le plus grand écart dans leur impact sur la survie des garçons...
Soit titit_i tiré iid d'une distribution de Student t avec degrés de liberté, pour taille moyenne (disons inférieure à 100). Définir est-il distribué presque comme un chi carré avec degrés de liberté? Existe-t-il quelque chose comme le théorème de la limite centrale pour la somme des variables...
Je fais référence à cet article: http://www.nytimes.com/2011/01/11/science/11esp.html Considérez l'expérience suivante. Supposons qu'il y ait des raisons de croire qu'une pièce est légèrement lestée vers les têtes. Dans un test, la pièce remonte 527 fois sur 1000. Est-ce une preuve significative...
Une fois qu'un modèle ARMA est adapté à une série chronologique, il est courant de vérifier les résidus via le test de portemanteau de Ljung-Box (entre autres tests). Le test Ljung-Box renvoie une valeur ap. Il a un paramètre, h , qui est le nombre de retards à tester. Certains textes recommandent...
J'utilise le package R pénalisé pour obtenir des estimations réduites des coefficients pour un ensemble de données où j'ai beaucoup de prédicteurs et peu de connaissances sur ceux qui sont importants. Après avoir choisi les paramètres de réglage L1 et L2 et que je suis satisfait de mes...
Dans le problème classique du collecteur de coupons , il est bien connu que le temps nécessaire pour terminer un ensemble de coupons choisis au hasard satisfait , , et .TTTnnnE[T]∼nlnnE[T]∼nlnnE[T] \sim n \ln n Var(T)∼n2Var(T)∼n2Var(T) \sim n^2Pr(T>nlnn+cn)<e−cPr(T>nlnn+cn)<e−c\Pr(T >...
Disons que je teste la façon dont une variable Ydépend d'une variable Xdans différentes conditions expérimentales et j'obtiens le graphique suivant: Les lignes en pointillés dans le graphique ci-dessus représentent une régression linéaire pour chaque série de données (configuration expérimentale)...
Dans les études d'association à l'échelle du génome (GWAS): Quels sont les principaux composants? Pourquoi sont-ils utilisés? Comment sont-ils calculés? Une étude d'association à l'échelle du génome peut-elle être réalisée sans utiliser l'ACP?
Compte tenu du modèle hiérarchique suivant, et, μ ~ L a p l a c e ( 0 , c ) où N ( ⋅ , ⋅ ) est une distribution normale. Existe-t-il un moyen d'obtenir une expression exacte pour les informations de Fisher de la distribution marginale de X étant donné c . Autrement dit, quelle est l'information de...
Dans mes tentatives pour lutter contre le chaos des feuilles de calcul, je suis souvent évangélique en plaidant pour des outils plus robustes tels que de vrais logiciels de statistiques (R, Stata, etc.). Récemment, j'ai été contesté sur ce point de vue par quelqu'un qui a déclaré catégoriquement...
La désaisonnalisation est une étape cruciale du prétraitement des données pour de plus amples recherches. Le chercheur a cependant un certain nombre d'options pour la décomposition tendance-cycle-saisonnière. Les méthodes de décomposition saisonnières rivales les plus courantes (à en juger par le...
J'ai exécuté un modèle logit multinomial dans JMP et obtenu des résultats qui comprenaient l'AIC ainsi que les valeurs de p chi carré pour chaque estimation de paramètre. Le modèle a un résultat catégorique et 7 variables explicatives catégoriques. J'ai ensuite adapté ce que je pensais construire...
J'essaie de mettre en place un package d'exploration de données pour les sites StackExchange et en particulier, je suis coincé en essayant de déterminer les questions "les plus intéressantes". Je voudrais utiliser le score de la question, mais supprimer le biais dû au nombre de vues, mais je ne...
migré depuis math.stackexchange . Je traite un long flux d'entiers et j'envisage de suivre quelques instants afin de pouvoir calculer approximativement divers centiles pour le flux sans stocker beaucoup de données. Quelle est la façon la plus simple de calculer des centiles à partir de quelques...