Quelles sont les hypothèses habituelles pour la régression linéaire? Incluent-ils: une relation linéaire entre la variable indépendante et la variable dépendante erreurs indépendantes distribution normale des erreurs homoscédasticité Y en a-t-il
Désigne les conditions dans lesquelles une procédure statistique produit des estimations et / ou des inférences valides. Par exemple, de nombreuses techniques statistiques nécessitent l'hypothèse que les données sont échantillonnées au hasard d'une manière ou d'une autre. Les résultats théoriques sur les estimateurs nécessitent généralement des hypothèses sur le mécanisme de génération des données.
Quelles sont les hypothèses habituelles pour la régression linéaire? Incluent-ils: une relation linéaire entre la variable indépendante et la variable dépendante erreurs indépendantes distribution normale des erreurs homoscédasticité Y en a-t-il
Je travaille actuellement sur un document de recherche quasi expérimental. Je n'ai qu'un échantillon de 15 personnes en raison de la faible population de la région choisie et du fait que 15 seulement correspondent à mes critères. 15 est la taille minimale de l'échantillon à calculer pour le test t...
Pour une étude de simulation , je dois générer des variables aléatoires qui montrent une corrélation prefined (population) à une variable existante .YYY J'ai examiné les Rpackages copulaet ceux CDVinequi peuvent produire des distributions multivariées aléatoires avec une structure de dépendance...
La page Wikipedia sur ANOVA énumère trois hypothèses , à savoir: Indépendance des cas - il s'agit d'une hypothèse du modèle qui simplifie l'analyse statistique. Normalité - les distributions des résidus sont normales. Égalité (ou "homogénéité") des variances, appelée homoscédasticité ... Le point...
Je suppose que je suis frustré chaque fois que j'entends quelqu'un dire que la non-normalité des résidus et / ou l'hétéroscédasticité enfreignent les suppositions de la méthode MCO. Pour estimer les paramètres dans un modèle MLS, aucune de ces hypothèses n'est nécessaire selon le théorème de...
Plusieurs sites de ce site discutent de la façon de déterminer si les résidus OLS sont distribués de manière asymptotique normalement. Un autre moyen d'évaluer la normalité des résidus avec le code R est fourni dans cette excellente réponse . Ceci est une autre discussion sur la différence pratique...
J'apprends l' analyse de survie de ce billet sur UCLA IDRE et je me suis fait avoir à la section 1.2.1. Le tutoriel dit: ... si on savait que les temps de survie étaient distribués de façon exponentielle , alors la probabilité d'observer un temps de survie ... Pourquoi les temps de survie sont-ils...
Examinons la figure suivante tirée de Modèles linéaires avec R de Faraway (2005, p. 59). Le premier graphique semble indiquer que les valeurs résiduelles et ajustées ne sont pas corrélées, car elles devraient figurer dans un modèle linéaire homoscédastique avec des erreurs distribuées normalement....
Je travaille avec un grand ensemble de données (confidentiel, donc je ne peux pas trop en partager), et suis arrivé à la conclusion qu'une régression binomiale négative serait nécessaire. Je n'ai jamais fait de régression glm auparavant et je ne trouve aucune information claire sur les hypothèses....
Ma question découle de ce commentaire sur un article de blog d'Andrew Gelman dans lequel il préconise l'utilisation d'intervalles de confiance de 50% au lieu d'intervalles de confiance de 95%, mais pas au motif qu'ils sont plus solidement estimés: Je préfère des intervalles de 50% à 95% pour 3...
J'essaie de comprendre ce que l' hypothèse d'observations indépendantes signifie. Certaines définitions sont: "Deux événements sont indépendants si et seulement si ." ( Dictionnaire des termes statistiques )P(a∩b)=P(a)∗P(b)P(a∩b)=P(a)∗P(b)P(a \cap b) = P(a) * P(b) "l'occurrence d'un événement ne...
À titre d'exemple, considérons l' ChickWeightensemble de données dans R. La variance augmente évidemment avec le temps, donc si j'utilise une régression linéaire simple comme: m <- lm(weight ~ Time*Diet, data=ChickWeight) Mes questions: Quels aspects du modèle seront discutables? Les problèmes...
Lors de l'ajustement d'un modèle de régression, que se passe-t-il si les hypothèses des résultats ne sont pas remplies, en particulier: Que se passe-t-il si les résidus ne sont pas homoscédastiques? Si les résidus montrent une tendance à la hausse ou à la baisse dans les résidus par rapport au...
J'ai appris que je dois tester la normalité non pas sur les données brutes mais sur leurs résidus. Dois-je calculer les résidus et ensuite faire le test W de Shapiro-Wilk? Les résidus sont-ils calculés comme : ?Xje- méchantXi−meanX_i - \text{mean} Veuillez consulter cette question précédente pour...
Le test de Mantel est généralement appliqué aux matrices de distance / différence symétriques. D'après ce que je comprends, une hypothèse du test est que la mesure utilisée pour définir les différences doit être au moins une semi-métrique (répondre aux exigences standard d'une métrique mais pas...
Je veux faire un modèle logistique à partir de mes données d'enquête. Il s'agit d'une petite enquête sur quatre colonies résidentielles dans laquelle seulement 154 répondants ont été interrogés. Ma variable dépendante est «transition satisfaisante vers le travail». J'ai constaté que, sur les 154...
J'ai exécuté une conception répétée selon laquelle j'ai testé 30 hommes et 30 femmes à travers trois tâches différentes. Je veux comprendre en quoi le comportement des hommes et des femmes est différent et comment cela dépend de la tâche. J'ai utilisé à la fois le package lmer et lme4 pour enquêter...
J'ai lu que le test t est "raisonnablement robuste" lorsque les distributions des échantillons s'écartent de la normalité. Bien sûr, c'est la distribution d'échantillonnage des différences qui est importante. J'ai des données pour deux groupes. L'un des groupes est fortement asymétrique sur la...
Je suis un peu confus quant aux hypothèses de régression linéaire. Jusqu'à présent, j'ai vérifié si: toutes les variables explicatives étaient corrélées linéairement avec la variable de réponse. (C'était le cas) il y avait une colinéarité entre les variables explicatives. (il y avait peu de...
Considérons le modèle standard de régression multiple où , donc la normalité, l'homoscédasticité et la non corrélation des erreurs sont toutes valables.Y=Xβ+εY=Xβ+εY=X\beta+\varepsilonε∼N(0,σ2In)ε∼N(0,σ2In)\varepsilon \sim \mathcal N(0, \sigma^2I_n) Supposons que nous effectuons une régression de...