Est-il possible d'ajuster un modèle de régression logistique? J'ai vu une vidéo disant que si ma zone sous la courbe ROC est supérieure à 95%, il est très probable qu'elle soit sur-ajustée, mais est-il possible de sur-adapter un modèle de régression
Est-il possible d'ajuster un modèle de régression logistique? J'ai vu une vidéo disant que si ma zone sous la courbe ROC est supérieure à 95%, il est très probable qu'elle soit sur-ajustée, mais est-il possible de sur-adapter un modèle de régression
Il existe trois variables aléatoires, x,y,zx,y,zx,y,z . Les trois corrélations entre les trois variables sont les mêmes. C'est, ρ=cor(x,y)=cor(x,z)=cor(y,z)ρ=cor(x,y)=cor(x,z)=cor(y,z)\rho=\textrm{cor}(x,y)=\textrm{cor}(x,z)=\textrm{cor}(y,z) Quelle est la limite la plus stricte que vous pouvez...
Le jeu de données "Iris" est probablement familier à la plupart des gens ici - c'est l'un des jeux de données de test canoniques et un jeu de données d'exemple pour tout, de la visualisation des données à l'apprentissage automatique. Par exemple, tout le monde dans cette question a fini par...
J'ai lu trois principales raisons de normaliser les variables avant quelque chose comme la Lassorégression: 1) Interprétabilité des coefficients. 2) Capacité de classer l'importance du coefficient en fonction de la magnitude relative des estimations du coefficient après retrait. 3) Pas besoin...
Je voudrais obtenir une valeur de p et une taille d'effet d'une variable catégorielle indépendante (avec plusieurs niveaux) - c'est-à-dire "global" et pas pour chaque niveau séparément, tout comme la sortie normale de lme4dans R. C'est comme la chose que les gens rapportent lorsqu'ils exécutent une...
Je suis confus. Y a-t-il une différence entre les réseaux de croyances profondes et les machines Deep Boltzmann? Si oui, quelle est la
Quelle est la différence entre un réseau bayésien et un processus de Markov? Je croyais comprendre les principes des deux, mais maintenant, quand j'ai besoin de comparer les deux, je me sens perdu. Ils signifient presque la même chose pour moi. Ils ne le sont certainement pas. Les liens vers...
Comme nous le savons tous, si vous lancez une pièce de monnaie qui a autant de chances d'atterrir des têtes que de la queue, alors si vous lancez la pièce plusieurs fois, la moitié du temps, vous obtiendrez des têtes et la moitié du temps, vous obtiendrez des queues. En discutant avec un ami, ils...
Je lisais aujourd'hui la classification Naive Bayes. J'ai lu, sous le titre d' estimation des paramètres avec l'ajout de 1 lissage : Soit référence à une classe (telle que positive ou négative), et référence à un jeton ou à un mot.cccwww L'estimateur du maximum de vraisemblance pour estP( w | c...
J'essaie de comprendre ce que l' hypothèse d'observations indépendantes signifie. Certaines définitions sont: "Deux événements sont indépendants si et seulement si ." ( Dictionnaire des termes statistiques )P(a∩b)=P(a)∗P(b)P(a∩b)=P(a)∗P(b)P(a \cap b) = P(a) * P(b) "l'occurrence d'un événement ne...
J'utilise R (3.1.1) et les modèles ARIMA pour les prévisions. Je voudrais savoir quel devrait être le paramètre "fréquence", qui est affecté dans la ts()fonction , si je utilise des données de séries chronologiques qui sont: séparés par des minutes et s'étalent sur 180 jours (1440 minutes / jour)...
J'utilise glmnet pour calculer les estimations de régression de crête. J'ai obtenu des résultats qui m'ont rendu suspect dans la mesure où glmnet fait vraiment ce que je pense qu'il fait. Pour vérifier cela, j'ai écrit un script R simple où je compare le résultat de la régression de crête effectuée...
Extrait du livre de David Salsburg The lady tasting tea : Bien que le lecteur ne puisse pas le croire, le style littéraire joue un rôle important dans la recherche mathématique. Certains auteurs mathématiques semblent incapables de produire des articles faciles à comprendre. D'autres semblent avoir...
Je suis en épidémiologie. Je ne suis pas statisticien mais j'essaie de faire les analyses moi-même, bien que je rencontre souvent des difficultés. J'ai fait ma première analyse il y a environ 2 ans. Les valeurs de p ont été incluses partout dans mes analyses (j'ai simplement fait ce que faisaient...
La marche aléatoire qui est définie comme , où est un bruit blanc. Indique que la position actuelle est la somme de la position précédente + un terme imprévu.Ouit= Yt - 1+ etYt=Yt−1+etY_{t} = Y_{t-1} + e_tetete_t Vous pouvez prouver que la fonction moyenne , puisqueμt= 0μt=0\mu_t = 0 E( Ot) = E(...
Le problème du lasso a la solution de forme fermée: \ beta_j ^ {\ text {lasso}} = \ mathrm {sgn} (\ beta ^ {\ text {LS}} _ j) (| \ beta_j ^ {\ text {LS }} | - \ alpha) ^ + si X a des colonnes orthonormées. Cela a été montré dans ce fil: Dérivation de la solution de lasso de forme fermée...
Prenons par exemple un modèle de régression linéaire. J'ai entendu dire que, dans l'exploration de données, après avoir effectué une sélection par étapes basée sur le critère AIC, il est trompeur de regarder les valeurs de p pour tester l'hypothèse nulle selon laquelle chaque véritable coefficient...
Je travaille sur l'apprentissage des probabilités et des statistiques en lisant quelques livres et en écrivant du code, et en simulant des lancers de pièces, j'ai remarqué quelque chose qui m'a semblé légèrement contraire à l'intuition naïve. Si vous lancez une pièce juste fois, le rapport des...
Lors de l'ajustement d'un modèle de régression, que se passe-t-il si les hypothèses des résultats ne sont pas remplies, en particulier: Que se passe-t-il si les résidus ne sont pas homoscédastiques? Si les résidus montrent une tendance à la hausse ou à la baisse dans les résidus par rapport au...
À titre d'exemple, prendre la fonction objective du modèle XGBoost sur le « e itération:ttt L(t)=∑i=1nℓ(yi,y^(t−1)i+ft(xi))+Ω(ft)L(t)=∑i=1nℓ(yi,y^i(t−1)+ft(xi))+Ω(ft)\mathcal{L}^{(t)}=\sum_{i=1}^n\ell(y_i,\hat{y}_i^{(t-1)}+f_t(\mathbf{x}_i))+\Omega(f_t) où est la fonction de perte, est le ième...