Statistiques et Big Data

11
Comment commencer à construire un modèle de régression lorsque le prédicteur le plus fortement associé est binaire

J'ai un ensemble de données contenant 365 observations de trois variables à savoir pm, tempet rain. Maintenant, je veux vérifier le comportement de la pmréponse aux changements dans les deux autres variables. Mes variables sont: pm10 = Réponse (dépendante) temp = prédicteur (indépendant) rain =...

11
Fiabilité d'une courbe ajustée?

Je voudrais estimer l'incertitude ou la fiabilité d'une courbe ajustée. Je ne nomme pas intentionnellement une quantité mathématique précise que je recherche, car je ne sais pas ce que c'est. Ici, (énergie) est la variable dépendante (réponse) et (volume) est la variable indépendante. Je voudrais...

11
Comment défini lorsque

Disons que YYY est une variable aléatoire continue et XXX est une variable discrète. Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y) \Pr(X=x|Y=y) = \frac{\Pr(X=x)\Pr(Y=y|X=x)}{\Pr(Y=y)} Comme nous le savons, Pr(Y=y)=0Pr(Y=y)=0\Pr(Y=y) = 0 car YYY est une variable...

11
Contre-exemples où la médiane est en dehors [Mode-Mean]

Cet article est au-dessus de ma ligue mais il parle d'un sujet qui m'intéresse, la relation entre la moyenne, le mode et la médiane. Ça dit : Il est largement admis que la médiane d'une distribution unimodale se situe «habituellement» entre la moyenne et le mode. Cependant, ceci n'est pas toujours...

11
Limites de généralisation sur SVM

Je m'intéresse aux résultats théoriques pour la capacité de généralisation des machines à vecteurs de support, par exemple les limites sur la probabilité d'erreur de classification et sur la dimension Vapnik-Chervonenkis (VC) de ces machines. Cependant, en lisant la littérature, j'ai eu...