J'ai créé cette courbe d'apprentissage et je veux savoir si mon modèle SVM souffre de biais ou de variance? Comment puis-je conclure cela à partir de ce graphique?
J'ai créé cette courbe d'apprentissage et je veux savoir si mon modèle SVM souffre de biais ou de variance? Comment puis-je conclure cela à partir de ce graphique?
J'ai lu le paradoxe des paris de Blackwell sur le placard Futility . Voici le résumé: vous êtes présenté avec deux enveloppes, et . Les enveloppes contiennent une somme d'argent aléatoire, mais vous ne savez rien de la distribution de l'argent. Vous en ouvrez un, vérifiez combien il y a d'argent (...
Supposons que j'ai des matrices de covariance et . Parmi ces options, lesquelles sont également des matrices de covariance?XXXOuiYY X+ YX+YX+Y X2X2X^2 XOuiXYXY J'ai un peu de mal à comprendre ce qui est exactement nécessaire pour que quelque chose soit une matrice de covariance. Je suppose que cela...
Souvent, je vois des auteurs estimer un modèle de «différence logarithmique», par exemple Journal( yt) - journal( yt - 1) = log( yt/ yt - 1) = α + βXtJournal(yt)-Journal(yt-1)=Journal(yt/yt-1)=α+βXt\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t Je conviens que cela est...
Quel est un exemple de colinéarité parfaite en termes de matrice de conception XXX ? Je voudrais un exemple où β = ( X ' X ) - 1 X ' Y ne peut pas être estimée parce que ( X ' X ) n'est pas inversible.β^=(X′X)−1X′Yβ^=(X′X)−1X′Y\hat \beta =
Zou et al. "Sur les" degrés de liberté "du lasso" (2007) montrent que le nombre de coefficients non nuls est une estimation non biaisée et cohérente des degrés de liberté du lasso. Cela me semble un peu contre-intuitif. Supposons que nous ayons un modèle de régression (où les variables sont à...
Je suis relativement nouveau dans l'apprentissage machine / modélisation et j'aimerais avoir des informations sur ce problème. J'ai un ensemble de données où le nombre d'observations est mais le nombre de variables est . Premièrement, est-il même judicieux d'envisager de construire un modèle sur un...
J'ai commencé à en apprendre davantage sur les réseaux de neurones avec le didacticiel neuromnetworksanddeeplearning dot com. En particulier dans le 3ème chapitre, il y a une section sur la fonction d'entropie croisée, et définit la perte d'entropie croisée comme:
J'utilise des modèles linéaires pour effectuer des tests de proportion à 2 échantillons depuis un certain temps, mais je me suis rendu compte que cela pourrait ne pas être complètement correct. Il semble que l'utilisation d'un modèle linéaire généralisé avec un lien famille binomiale + identité...
Disons que nous avons une variable aléatoire avec une plage de valeurs délimitées par et , où est la valeur minimale et la valeur maximale.b a buneaabbbuneaabbb On m'a dit que comme , où est notre taille d'échantillon, la distribution d'échantillonnage de nos moyennes d'échantillon est une...
Les analyses de régression modérée sont souvent utilisées en sciences sociales pour évaluer l'interaction entre deux ou plusieurs prédicteurs / covariables. En règle générale, avec deux variables prédictives, le modèle suivant est appliqué: Y=β0+β1∗X+β2∗M+β3∗XM+eY=β0+β1∗X+β2∗M+β3∗XM+eY = β_0 +...
Je travaille actuellement sur la construction d'un modèle prédictif pour un résultat binaire sur un ensemble de données avec environ 300 variables et 800 observations. J'ai beaucoup lu sur ce site sur les problèmes liés à la régression pas à pas et pourquoi ne pas l'utiliser. J'ai lu la régression...
Dans l'apprentissage automatique (pour les problèmes de régression), je vois souvent l'erreur quadratique moyenne (MSE) ou l'erreur absolue moyenne (MAE) utilisée comme fonction d'erreur pour minimiser (plus le terme de régularisation). Je me demande s'il existe des situations où l'utilisation d'un...
J'ai une série chronologique quotidienne assez prévisible avec une saisonnalité hebdomadaire. Je peux proposer des prédictions qui semblent assez précises (confirmées par validation croisée) quand il n'y a pas de vacances. Cependant, quand il y a des vacances, j'ai les problèmes suivants: J'obtiens...
Je lis ici l'article de Wikipédia sur les modèles statistiques et je suis quelque peu perplexe quant à la signification des "modèles statistiques non paramétriques", en particulier: Un modèle statistique n'est pas paramétrique si l'ensemble de paramètres est de dimension infinie. Un modèle...
Je souhaiterais obtenir des intervalles de confiance à 95% sur les prédictions d'un nlmemodèle mixte non linéaire . Étant donné que rien de standard n'est fourni pour le faire à l'intérieur nlme, je me demandais s'il était correct d'utiliser la méthode des "intervalles de prédiction de population",...
LASSO et LASSO adaptatif sont deux choses différentes, non? (Pour moi, les pénalités sont différentes, mais je vérifie simplement si je manque quelque chose.) Quand on parle généralement de filet élastique, est-ce le cas particulier LASSO ou LASSO adaptatif? Lequel le paquet glmnet fait-il, à...
Les économétriciens universitaires sont souvent intéressés à déterminer la causalité. Il semble que tous les emplois en statistique / science des données du secteur privé dont j'entends parler ne recherchent que des modèles prédictifs. Y a-t-il des emplois dans le secteur privé (ou des emplois...
Nous avons une grande variété de méthodes de génération aléatoire à partir de distributions univariées (transformation inverse, acceptation-rejet, Metropolis-Hastings, etc.) et il semble que nous pouvons échantillonner à partir de n'importe quelle distribution valide - est-ce vrai? Pourriez-vous...
Je vais utiliser le test de Kolmogorov-Smirnov pour tester la normalité de MYDATA en R. Ceci est un exemple de ce que je fais ks.test(MYDATA,"pnorm",mean(MYDATA),sd(MYDATA)) Voici le résultat que R me donne: data: MYDATA D = 0.13527, p-value = 0.1721 alternative hypothesis: two-sided Warning...