D'accord, juste un peu flou sur certaines choses, toute aide serait très appréciée. Je crois comprendre que le modèle de régression linéaire est prédit via une attente conditionnelle
- Supposons-nous que et Y sont des variables aléatoires avec une distribution de probabilité inconnue? j'ai cru comprendre que seuls les résidus et les coefficients bêta estimés étaient des variables aléatoires. si c'est le cas, par exemple, si Y = obésité et X = âge, si nous prenons la signification de l'espérance conditionnelle E (Y | X = 35) , quelle est la valeur attendue d'être obèse si l'individu a 35 ans dans l'échantillon, serions-nous il suffit de prendre la moyenne (moyenne arithmétique) de y pour les observations où X = 35 ? mais la valeur attendue n'implique-t-elle pas que nous devions multiplier cela par la probabilité de se produire? mais comment, dans ce sens, nous trouvons la probabilité du XYX = E ( Y | X = 35 ) 35 X = 35 X-variable variable se produisant si elle représente quelque chose comme l'âge?
- Si représentait quelque chose comme le taux de change, cela serait-il classé comme aléatoire? comment diable trouveriez-vous la valeur attendue de cela sans connaître la probabilité? ou la valeur attendue serait-elle juste égale à la moyenne de la limite.
- Si nous ne supposons pas que les variables dépendantes sont elles-mêmes des variables aléatoires, puisque nous n'opposons pas la probabilité, que supposons-nous qu'elles le sont? juste des valeurs fixes ou quelque chose? mais si tel est le cas, comment conditionner d'abord une variable non aléatoire? que supposons-nous de la distribution des variables indépendantes?
Désolé si quelque chose n'a pas de sens ou est évident pour personne.
regression
William Carulli
la source
la source
Réponses:
Dans le modèle de probabilité sous-jacent à la régression linéaire, X et Y sont des variables aléatoires.
C'est vrai. En général, vous ne pouvez pas vous attendre à disposer de suffisamment de données à chaque valeur spécifique de X, ou il peut être impossible de le faire si X peut prendre une plage continue de valeurs. Mais conceptuellement, c'est correct.
Il s'agit de la différence entre l' espérance inconditionnelle et l' espérance conditionnelle . La relation entre eux estE [ Y ∣ X = x ]E[ Oui] E[ Oui∣ X= x ]
qui est la loi de l'attente totale.
Généralement, vous ne faites pas de régression linéaire. Puisque nous essayons de déterminer , nous n'avons pas besoin de connaître .P r [ X = x ]E[ Oui∣ X] Pr [ X= x ]
Nous ne supposons que Y est une variable aléatoire. Une façon de penser à la régression linéaire est comme un modèle de probabilité pourOui
Ce qui veut dire que, une fois que l'on connaît la valeur de X, la variation aléatoire de Y se limite au sommet .N( 0 , σ)
la source
Il y aura BEAUCOUP de réponses à cette question, mais je veux quand même en ajouter une puisque vous avez soulevé des points intéressants. Par souci de simplicité, je ne considère que le modèle linéaire simple.
L'équation fondamentale de la simple analyse de régression linéaire est la suivante : Ce sens d'équation est que la valeur moyenne de est linéaire sur les valeurs de . On peut également remarquer que la valeur attendue est également linéaire sur les paramètres et , c'est pourquoi le modèle est appelé linéaire. Cette équation fondamentale peut être réécrite comme: où est une variable aléatoire avec une moyenne nulle:Y X β 0 β 1 Y = β 0 + β 1 X + ϵ , ϵ E ( ϵ ) = 0
La variable indépendante peut être aléatoire ou fixe. La variable dépendante est TOUJOURS aléatoire.YX Oui
On suppose généralement que sont des nombres fixes. C'est parce que l'analyse de régression a été développée et est largement appliquée dans le contexte des expériences conçues, où les valeurs de sont précédemment fixées.X{ X1, . . . , Xn} X
Les formules pour les estimations des moindres carrés de et sont les mêmes même si les sont supposés aléatoires, mais la distribution de ces estimations ne sera généralement pas la même par rapport à la situation avec des fixes .β 1 X Xβ0 β1 X X
Dans le modèle linéaire simple, vous pouvez construire une estimation de basée sur les estimations de et , à savoir: L' conditionnel moyen au carré a une expression égale à celle que vous avez décrite si votre modèle traite les différents poids comme des niveaux d'un seul facteur. Ces modèles sont également connus sous le nom d'ANOVA unidirectionnelle, qui est un cas particulier de modèle linéaire (pas simple).E(Y|X=x) β 0 β 1 φ (x)= β 0 +φ^( x ) E ( Y| X= x ) β^0 β^1
la source