J'utilise R pour effectuer une régression linéaire. J'ai vu des moyens de calculer les intervalles de prédiction, mais ceux-ci dépendent de données homoscédastiques. Existe-t-il un moyen de calculer les intervalles de prédiction avec des données
J'utilise R pour effectuer une régression linéaire. J'ai vu des moyens de calculer les intervalles de prédiction, mais ceux-ci dépendent de données homoscédastiques. Existe-t-il un moyen de calculer les intervalles de prédiction avec des données
Communauté SE, j'espère avoir un aperçu du problème suivant. Étant donné un modèle de régression linéaire simpleY=Xβ+ϵ , where Y∈RT,X∈RT×N.Y=Xβ+ϵ , where Y∈RT,X∈RT×N.Y=X\beta+\epsilon\text{ , where } Y\in\mathbb{R}^T,X\in\mathbb{R}^{T \times N}. Sous une fonction de vraisemblance gaussienne avec...
J'utilise la fonction Deming fournie par Terry T. sur ce fil de discussion r-help archivé . Je compare deux méthodes, j'ai donc des données qui ressemblent à ceci: y x stdy stdx 1 1.2 0.23 0.67 2 1.8 0.05 0.89 4 7.5 1.13 0.44 ... ... ... ... J'ai effectué ma régression de Deming (également appelée...
J'ai trouvé que pour un modèle de régression linéaire simple, OLS et la méthode du maximum de vraisemblance (en supposant une distribution normale) donnent le même résultat (valeurs des paramètres). À partir de là, pouvons-nous dire que l'OLS fait également des hypothèses implicites sur la...
Dans le livre "Les éléments de l'apprentissage statistique" au chapitre 2 ("Modèles linéaires et moindres carrés; page n °: 12"), il est écrit que Dans l'espace d'entrée-sortie (p + 1), (X, Y) représente un hyperplan. Si la constante est incluse dans X, l'hyperplan inclut l'origine et est un...
Disons que j'ai trois ensembles de données de taille chacun:nnn y1y1y_1 = taille des personnes des États-Unis uniquement y2y2y_2 = hauteurs des hommes du monde entier y3y3y_3 = hauteurs des femmes du monde entier Et je construis un modèle linéaire pour chacun avec des facteurs xixix_i ,...
J'ajuste quelques modèles additifs généralisés en utilisant le mgcvpackage en R, et je veux tester entre deux modèles; si je peux supprimer un terme ou non. Cependant, j'obtiens des résultats contradictoires (pour autant que je sache). Un modèle, m1avec un terme lisse pour xajouté, semble donner un...
J'ai lu les excellents commentaires sur la façon de traiter les valeurs manquantes avant d'appliquer SVD, mais j'aimerais savoir comment cela fonctionne avec un exemple simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Étant donné la matrice ci-dessus, si je...
Pourquoi utiliserions-nous des cotes plutôt que des probabilités lors de la régression
Le graphique ci-dessous montre la saturation d'une route par rapport à l'impact sur le temps de trajet (normalisé en temps de trajet en flux libre). La courbe bleue (fonction BPR) présente un modèle standardisé utilisé sur le terrain pour relier le temps de trajet et la saturation. Pour les données...
Comme échauffement avec des réseaux de neurones récurrents, j'essaie de prédire une onde sinusoïdale à partir d'une autre onde sinusoïdale d'une autre fréquence. Mon modèle est un simple RNN, sa passe avant peut s'exprimer comme suit: rtzt= σ(Wje n⋅Xt+Wr e c⋅rt - 1) )=Wo u...
J'analyse un ensemble de données contenant des observations de n nombre de tentatives par des joueurs dans un jeu. Si je construis un modèle de régression pour prédire le résultat de chaque tentative avec un ou plusieurs descripteurs concernant chaque tentative de joueur , comment puis-je mesurer...
Permettez-moi d'abord de donner quelques informations; Je résumerai mes questions à la fin. La distribution bêta, paramétrée par sa moyenne et , a , où est la fonction de variance.μμ\muϕϕ\phiVar(Y)=V(μ)/(ϕ+1)Var(Y)=V(μ)/(ϕ+1)\operatorname{Var}(Y) =
De Wikipédia: En modélisation statistique, l' analyse de régression est un processus statistique permettant d'estimer les relations entre les variables. Il comprend de nombreuses techniques de modélisation et d'analyse de plusieurs variables, lorsque l'accent est mis sur la relation entre une...
Je n'arrive pas à interpréter ce graphique. Ma variable dépendante est le nombre total de billets de cinéma qui seront vendus pour un spectacle. Les variables indépendantes sont le nombre de jours restants avant le spectacle, les variables factices saisonnières (jour de la semaine, mois de l'année,...
Je veux régresser l'économie de carburant sur la cylindrée du moteur, le type de carburant, la transmission 2 vs 4 roues motrices, la puissance, la transmission manuelle vs automatique et le nombre de vitesses. Mon ensemble de données ( lien ) contient des véhicules de 2012 à 2014. fuelEconomy en...
Je suis nouveau dans la conversion de formules en formulaire matriciel. Mais cela est nécessaire pour un code d'apprentissage automatique efficace. Je veux donc comprendre la "bonne" façon, pas les trucs de cow-boy que je fais. D'accord, j'essaie de convertir la somme pondérée des carrés de la...
Suite à une question posée précédemment, les facteurs d'inflation de la variance (VIF) peuvent être exprimés comme est la version mise à l'échelle de la longueur unitaire deVIFj=Var(b^j)σ2=[w′jwj−w′jW−j(W′−jW−j)−1W′−jwj]−1VIFj=Var(b^j)σ2=[wj′wj−wj′W−j(W−j′W−j)−1W−j′wj]−1 \textrm{VIF}_j =...
Est-il courant d'avoir une technique de régression différente aux feuilles d'un arbre de régression (par exemple la régression linéaire)? Je le cherche depuis une heure, mais je ne trouve que des implémentations qui ont une valeur constante aux feuilles des arbres. Y a-t-il une raison pour laquelle...
J'essaie de voir si les variables x et y ensemble ou séparément affectent significativement Q_7 (dont l'histogramme est ci-dessus). J'ai exécuté un test de normalité Shapiro-Wilk et j'ai obtenu ce qui suit shapiro.test(Q_7) ## data: Q_7 ## W = 0.68439, p-value < 2.2e-16 Avec cette distribution,...