Est-ce que quelqu'un sait comment déterminer si les points 7, 16 et 29 sont des points d'influence ou non? J'ai lu quelque part que parce que la distance de Cook est inférieure à 1, ils ne le sont pas. Ai-je raison?
Des mesures diagnostiques (telles que les résidus ou certaines statistiques sommaires calculées à partir des résidus) sont utilisées pour évaluer certains aspects de la qualité de l'ajustement du modèle aux données.
Est-ce que quelqu'un sait comment déterminer si les points 7, 16 et 29 sont des points d'influence ou non? J'ai lu quelque part que parce que la distance de Cook est inférieure à 1, ils ne le sont pas. Ai-je raison?
Je cherche des directives sur la manière d’interpréter les graphes résiduels de modèles GLM. Surtout poisson, modèle binomial négatif, binomial. Que pouvons-nous attendre de ces parcelles lorsque les modèles sont "corrects"? (par exemple, nous nous attendons à ce que la variance augmente à mesure...
Je voulais faire une démonstration de classe où je compare un intervalle t à un intervalle de bootstrap et calcule la probabilité de couverture des deux. Je voulais que les données proviennent d'une distribution asymétrique, j'ai donc choisi de générer les données sous la forme d' exp(rnorm(10, 0,...
Supposons que je vais faire une régression logistique univariée sur plusieurs variables indépendantes, comme ceci: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) J'ai fait une comparaison de modèle (test de rapport de...
Suite à ma question pour l'OLS , je me demande: quels graphiques de diagnostic existent pour la régression quantile? (et y en a-t-il une mise en œuvre?) Une recherche rapide sur Google a déjà abouti à l' intrigue du ver (dont je n'ai jamais entendu parler auparavant), et je serais heureux de...
Une expérience de détection de signal présente généralement à l'observateur (ou au système de diagnostic) un signal ou un non-signal, et l'observateur est invité à indiquer s'il pense que l'élément présenté est un signal ou un non-signal. De telles expériences produisent des données qui remplissent...
J'utilise un échantillonneur Metropolis (C ++) et je veux utiliser les échantillons précédents pour estimer le taux de convergence. Un diagnostic facile à mettre en œuvre que j'ai trouvé est le diagnostic de Geweke , qui calcule la différence entre les deux moyennes d'échantillon divisée par son...
J'ai monté mon modèle et j'essaie de comprendre si c'est bon. J'ai calculé les métriques recommandées pour l'évaluer ( R2R2R^2 / AUC / précision / erreur de prédiction / etc) mais je ne sais pas comment les interpréter. En bref, comment savoir si mon modèle est bon en fonction de la métrique? Est...
J'ai vu des formules sur Wikipédia. qui concernent la distance et l'effet de levier de Mahalanobis: La distance de Mahalanobis est étroitement liée à la statistique de l'effet de levier, , mais a une échelle différente:hhhD2=(N−1)(h−1N).D2=(N−1)(h−1N).D^2 = (N - 1)(h - \tfrac{1}{N}). Dans un...
Je connais le test de réinitialisation Ramsey qui peut détecter des dépendances non linéaires. Cependant, si vous jetez simplement l'un des coefficients de régression (simplement des dépendances linéaires), vous pouvez obtenir un biais, selon les corrélations. Ceci n'est évidemment pas détecté par...
J'observe d'étranges schémas de résidus pour mes données: [EDIT] Voici les graphiques de régression partielle pour les deux variables: [EDIT2] Ajout du tracé PP La distribution semble bien se passer (voir ci-dessous) mais je n'ai aucune idée d'où cette ligne droite pourrait provenir. Des idées?...
Dans une régression linéaire simple, on veut souvent vérifier si certaines hypothèses sont remplies pour pouvoir faire l'inférence (par exemple, les résidus sont normalement distribués). Est-il raisonnable de vérifier les hypothèses en vérifiant si les valeurs ajustées sont normalement distribuées?...
J'ai commencé à creuser un peu dans la fonction plot.lm , cette fonction donne six tracés pour lm, ce sont: un tracé des résidus par rapport aux valeurs ajustées un graphique Scale-Location de sqrt (| résidus |) par rapport aux valeurs ajustées un tracé QQ normal, un tracé des distances de Cook par...
J'ai une demi-heure de données sur la demande, qui est une série chronologique multi-saisonnière. J'ai utilisé tbatsdans le forecastpackage en R, et obtenu des résultats comme celui-ci: TBATS(1, {5,4}, 0.838, {<48,6>, <336,6>, <17520,5>}) Cela signifie-t-il que la série ne doit...
Existe-t-il des hypothèses particulières concernant les erreurs de régression logistique telles que la variance constante des termes d'erreur et la normalité des résidus? En règle générale, lorsque vous avez des points dont la distance du cuisinier est supérieure à 4 / n, les supprimez-vous? Si...
Avant de poser cette question, j'ai fait une recherche sur notre site et j'ai trouvé beaucoup de questions similaires (comme ici , ici et ici ). Mais je pense que ces questions connexes n'ont pas été bien répondues ou discutées, je voudrais donc soulever à nouveau cette question. Je pense qu'il...
L'enseignement standard dit que la sensibilité et la spécificité sont des propriétés du test et sont indépendantes de la prévalence. Mais n'est-ce pas juste une supposition? Les principes de la médecine interne de Harrison, 19e éd., Disent Il a longtemps été affirmé que la sensibilité et la...
Lors de la régression linéaire multiple OLS, plutôt que de tracer les résidus par rapport aux valeurs ajustées, je trace les résidus Studentized (internes) par rapport aux valeurs ajustées (idem pour les covariables). Ces résidus sont définis comme: e∗je= ejes2( 1 - hje...
Je suis en train de reproduire ce que la fonction dfbetas()fait dans R . dfbeta() n'est pas un problème ... Voici un ensemble de vecteurs: x <- c(0.512, 0.166, -0.142, -0.614, 12.72) y <- c(0.545, -0.02, -0.137, -0.751, 1.344) Si j'adapte deux modèles de régression comme suit: fit1 <- lm(y...
Tout d'abord, permettez-moi de dire que j'ai suivi un cours de statistiques à l'école d'ingénieur il y a 38 ans. Alors je vole aveugle ici. J'ai les résultats de ce qui sont essentiellement 18 tests de diagnostic distincts pour une maladie. Chaque test est binaire - oui / non, sans seuil pouvant...