Statistiques et Big Data

8
Processus de Dirichlet pour l'apprentissage supervisé?

Il semble que lorsque je jette un coup d'œil ici aux algorithmes d'apprentissage à la mode, des choses comme les réseaux de neurones, les arbres boostés, les machines à vecteurs de support, les forêts aléatoires et les amis sont promus pour les problèmes d'apprentissage supervisé. Les processus de...

8
OLS:

Supposons que sont des séries chronologiques avec , ( et est similaire à celle de , mais change lorsque le mannequin = 1). et , . Dans un contexte réel, il s'agira de rendements boursiers périodiques sur entreprises (mais vous pouvez ignorer cela). Il existe un mannequin, qui est égal à l'unité sur...

8
valeur p comme distance?

Les valeurs de p entre plusieurs tests par paire peuvent-elles être considérées comme une mesure de similitude / distance et une mise à l'échelle multidimensionnelle peut-elle être appliquée sur une matrice de paires de valeurs de p pour réduire la dimensionnalité? C'est une question douce, mais...

8
Intervalles de confiance lors de l'utilisation du théorème de Bayes

Je calcule des probabilités conditionnelles et des intervalles de confiance à 95% associés. Pour bon nombre de mes cas, j'ai un décompte simple des xsuccès des nessais (à partir d'un tableau de contingence), donc je peux utiliser un intervalle de confiance binomial, tel que celui fourni par...

8
Comprendre le problème Behrens – Fisher

Cette section de cet article dit: Ronald Fisher en 1935 a introduit l'inférence fiduciale afin de l'appliquer à ce problème. Il a fait référence à un article antérieur de WV Behrens de 1929. Behrens et Fisher ont proposé de trouver la distribution de probabilité de où et sont les deux moyennes...

8
détection du plagiat sur test à choix multiples

Supposons qu'un surveillant soupçonne un élève de copier les réponses sur le papier d'un autre élève lors d'un examen à choix multiples. Elle vérifie plus tard leurs réponses et trouve des similitudes, mais d'un autre côté, il y a forcément des similitudes étant donné la nature de l'examen. Comment...

8
Calcul de la précision et du rappel dans R

Supposons que je construis un classificateur de régression logistique qui prédit si quelqu'un est marié ou célibataire. (1 = marié, 0 = célibataire) Je veux choisir un point sur la courbe précision-rappel qui me donne au moins 75% de précision, donc je veux choisir les seuils et , de sorte...

8
Pourquoi une chaîne de Markov finie, irréductible et apériodique avec une matrice P doublement stochastique a-t-elle une distribution limite uniforme?

Le théorème est "Si une matrice de transition pour une chaîne de Markov irréductible avec un espace d'état fini S est doublement stochastique, sa mesure invariante (unique) est uniforme sur S." Si une chaîne de Markov a une matrice de transition doublement stochastique, j'ai lu que ses probabilités...