Statistiques et Big Data

10
Choix du nombre de composants principaux à conserver

Une méthode qui m'a été suggérée est de regarder un tracé d'éboulis et de vérifier le «coude» pour déterminer le nombre correct de PC à utiliser. Mais si l'intrigue n'est pas claire, R a-t-il un calcul pour déterminer le nombre? fit <- princomp(mydata,

10
Modèle de Dirichlet multinomial avec distribution hyperprior sur les paramètres de concentration

Je vais essayer de décrire le problème en question aussi général que possible. Je modélise les observations comme une distribution catégorielle avec un vecteur de probabilité de paramètre thêta. Ensuite, je suppose que le vecteur paramètre thêta suit une distribution a priori de Dirichlet avec les...

10
Valeur attendue d'une variable aléatoire gaussienne transformée avec une fonction logistique

La fonction logistique et l'écart type sont généralement notés . J'utiliserai et pour l'écart-type.σ ( x ) = 1 / ( 1 + exp ( - x ) ) sσσ\sigmaσ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x))sss J'ai un neurone logistique avec une entrée aléatoire dont la moyenne et écart - type je...

10
Résiduel influent vs valeur aberrante

Tout d'abord, je dois dire que j'ai cherché sur ce site la réponse. Soit je n'ai pas trouvé de question qui répondait à ma question, soit mon niveau de connaissances est si bas que je ne savais pas que j'avais déjà lu la réponse. J'étudie pour l'examen statistique AP. Je dois apprendre la...