Statistiques et Big Data

28

Surajustement d'un modèle de régression logistique

Est-il possible d'ajuster un modèle de régression logistique? J'ai vu une vidéo disant que si ma zone sous la courbe ROC est supérieure à 95%, il est très probable qu'elle soit sur-ajustée, mais est-il possible de sur-adapter un modèle de régression

logistic overfitting regression-strategies

28

Lié pour la corrélation de trois variables aléatoires

Il existe trois variables aléatoires, x,y,zx,y,zx,y,z . Les trois corrélations entre les trois variables sont les mêmes. C'est, ρ=cor(x,y)=cor(x,z)=cor(y,z)ρ=cor(x,y)=cor(x,z)=cor(y,z)\rho=\textrm{cor}(x,y)=\textrm{cor}(x,z)=\textrm{cor}(y,z) Quelle est la limite la plus stricte que vous pouvez...

correlation correlation-matrix

28

Quels aspects de l'ensemble de données «Iris» le rendent si efficace en tant qu'ensemble de données d'exemple / d'enseignement / de test

Le jeu de données "Iris" est probablement familier à la plupart des gens ici - c'est l'un des jeux de données de test canoniques et un jeu de données d'exemple pour tout, de la visualisation des données à l'apprentissage automatique. Par exemple, tout le monde dans cette question a fini par...

dataset

28

La standardisation avant Lasso est-elle vraiment nécessaire?

J'ai lu trois principales raisons de normaliser les variables avant quelque chose comme la Lassorégression: 1) Interprétabilité des coefficients. 2) Capacité de classer l'importance du coefficient en fonction de la magnitude relative des estimations du coefficient après retrait. 3) Pas besoin...

normalization lasso standardization regularization shrinkage

28

Comment obtenir une valeur de p et une taille d'effet «globales» pour un facteur catégoriel dans un modèle mixte (lme4)?

Je voudrais obtenir une valeur de p et une taille d'effet d'une variable catégorielle indépendante (avec plusieurs niveaux) - c'est-à-dire "global" et pas pour chaque niveau séparément, tout comme la sortie normale de lme4dans R. C'est comme la chose que les gens rapportent lorsqu'ils exécutent une...

r hypothesis-testing anova mixed-model lme4-nlme

28

Réseaux de croyances profondes ou machines Deep Boltzmann?

Je suis confus. Y a-t-il une différence entre les réseaux de croyances profondes et les machines Deep Boltzmann? Si oui, quelle est la

machine-learning deep-learning rbm deep-belief-networks

28

Différence entre les réseaux bayésiens et le processus de Markov?

Quelle est la différence entre un réseau bayésien et un processus de Markov? Je croyais comprendre les principes des deux, mais maintenant, quand j'ai besoin de comparer les deux, je me sens perdu. Ils signifient presque la même chose pour moi. Ils ne le sont certainement pas. Les liens vers...

bayesian references modeling markov-process bayesian-network

28

Quel est le nom de l'erreur statistique selon laquelle les résultats des tours de pièces précédents influencent les croyances au sujet des tours de pièces suivants?

Comme nous le savons tous, si vous lancez une pièce de monnaie qui a autant de chances d'atterrir des têtes que de la queue, alors si vous lancez la pièce plusieurs fois, la moitié du temps, vous obtiendrez des têtes et la moitié du temps, vous obtiendrez des queues. En discutant avec un ami, ils...

probability distributions sampling

28

Dans Naive Bayes, pourquoi s'embêter avec le lissage de Laplace alors que nous avons des mots inconnus dans le test?

Je lisais aujourd'hui la classification Naive Bayes. J'ai lu, sous le titre d' estimation des paramètres avec l'ajout de 1 lissage : Soit référence à une classe (telle que positive ou négative), et référence à un jeton ou à un mot.cccwww L'estimateur du maximum de vraisemblance pour estP( w | c...

machine-learning classification text-mining naive-bayes laplace-smoothing

28

Que signifie «observations indépendantes»?

J'essaie de comprendre ce que l' hypothèse d'observations indépendantes signifie. Certaines définitions sont: "Deux événements sont indépendants si et seulement si ." ( Dictionnaire des termes statistiques )P(a∩b)=P(a)∗P(b)P(a∩b)=P(a)∗P(b)P(a \cap b) = P(a) * P(b) "l'occurrence d'un événement ne...

probability sampling multilevel-analysis independence assumptions

28

Valeur de «fréquence» pour les données d'intervalle de secondes / minutes en R

J'utilise R (3.1.1) et les modèles ARIMA pour les prévisions. Je voudrais savoir quel devrait être le paramètre "fréquence", qui est affecté dans la ts()fonction , si je utilise des données de séries chronologiques qui sont: séparés par des minutes et s'étalent sur 180 jours (1440 minutes / jour)...

r time-series arima multiple-seasonalities mape

28

Pourquoi la régression de la crête glmnet me donne-t-elle une réponse différente du calcul manuel?

J'utilise glmnet pour calculer les estimations de régression de crête. J'ai obtenu des résultats qui m'ont rendu suspect dans la mesure où glmnet fait vraiment ce que je pense qu'il fait. Pour vérifier cela, j'ai écrit un script R simple où je compare le résultat de la régression de crête effectuée...

r ridge-regression glmnet

28

Papiers magnifiquement écrits

Extrait du livre de David Salsburg The lady tasting tea : Bien que le lecteur ne puisse pas le croire, le style littéraire joue un rôle important dans la recherche mathématique. Certains auteurs mathématiques semblent incapables de produire des articles faciles à comprendre. D'autres semblent avoir...

references communication

28

L'abondance des valeurs de P en l'absence d'hypothèse

Je suis en épidémiologie. Je ne suis pas statisticien mais j'essaie de faire les analyses moi-même, bien que je rencontre souvent des difficultés. J'ai fait ma première analyse il y a environ 2 ans. Les valeurs de p ont été incluses partout dans mes analyses (j'ai simplement fait ce que faisaient...

probability hypothesis-testing statistical-significance p-value

28

Pourquoi la variance de la marche aléatoire augmente-t-elle?

La marche aléatoire qui est définie comme , où est un bruit blanc. Indique que la position actuelle est la somme de la position précédente + un terme imprévu.Ouit= Yt - 1+ etYt=Yt−1+etY_{t} = Y_{t-1} + e_tetete_t Vous pouvez prouver que la fonction moyenne , puisqueμt= 0μt=0\mu_t = 0 E( Ot) = E(...

time-series self-study mathematical-statistics stochastic-processes random-walk

28

Pourquoi ma dérivation d'une solution de lasso de forme fermée est-elle incorrecte?

Le problème du lasso a la solution de forme fermée: \ beta_j ^ {\ text {lasso}} = \ mathrm {sgn} (\ beta ^ {\ text {LS}} _ j) (| \ beta_j ^ {\ text {LS }} | - \ alpha) ^ + si X a des colonnes orthonormées. Cela a été montré dans ce fil: Dérivation de la solution de lasso de forme fermée...

regression lasso regularization

28

Pourquoi les valeurs de p sont-elles trompeuses après avoir effectué une sélection pas à pas?

Prenons par exemple un modèle de régression linéaire. J'ai entendu dire que, dans l'exploration de données, après avoir effectué une sélection par étapes basée sur le critère AIC, il est trompeur de regarder les valeurs de p pour tester l'hypothèse nulle selon laquelle chaque véritable coefficient...

multiple-regression predictive-models data-mining stepwise-regression

28

Concept statistique pour expliquer pourquoi vous êtes moins susceptible de retourner le même nombre de têtes que de queues, à mesure que le nombre de retournements augmente?

Je travaille sur l'apprentissage des probabilités et des statistiques en lisant quelques livres et en écrivant du code, et en simulant des lancers de pièces, j'ai remarqué quelque chose qui m'a semblé légèrement contraire à l'intuition naïve. Si vous lancez une pièce juste fois, le rapport des...

probability computational-statistics

28

Dans quelle mesure un modèle de régression est-il incorrect lorsque les hypothèses ne sont pas remplies?

Lors de l'ajustement d'un modèle de régression, que se passe-t-il si les hypothèses des résultats ne sont pas remplies, en particulier: Que se passe-t-il si les résidus ne sont pas homoscédastiques? Si les résidus montrent une tendance à la hausse ou à la baisse dans les résidus par rapport au...

regression multiple-regression error assumptions normality-assumption

28

Approximation de la fonction de perte XGBoost avec expansion de Taylor

À titre d'exemple, prendre la fonction objective du modèle XGBoost sur le « e itération:ttt L(t)=∑i=1nℓ(yi,y^(t−1)i+ft(xi))+Ω(ft)L(t)=∑i=1nℓ(yi,y^i(t−1)+ft(xi))+Ω(ft)\mathcal{L}^{(t)}=\sum_{i=1}^n\ell(y_i,\hat{y}_i^{(t-1)}+f_t(\mathbf{x}_i))+\Omega(f_t) où est la fonction de perte, est le ième...

optimization loss-functions boosting xgboost taylor-series