Statistiques et Big Data

13
Théorème de Bayes avec plusieurs conditions

Je ne comprends pas comment cette équation a été dérivée. P(I|M1∩M2)≤P(I)P(I′)⋅P(M1|I)P(M2|I)P(M1|I′)P(M2|I′)P(I|M1∩M2)≤P(I)P(I′)⋅P(M1|I)P(M2|I)P(M1|I′)P(M2|I′)P(I|M_{1}\cap M_{2}) \leq \frac{P(I)}{P(I')}\cdot \frac{P(M_{1}|I)P(M_{2}|I)}{P(M_{1}|I')P(M_{2}|I')} Cette équation est tirée de l'étude...

13
La normalité conjointe est-elle une condition nécessaire pour que la somme des variables aléatoires normales soit normale?

Dans les commentaires qui suivent ma réponse à une question connexe, les utilisateurs ssdecontrol et Glen_b ont demandé si la normalité conjointe de et était nécessaire pour affirmer la normalité de la somme ? Bien entendu, le fait que la normalité commune soit suffisante est bien connu. Cette...

13
Évaluer la forêt aléatoire: OOB vs CV

Lorsque nous évaluons la qualité d'une forêt aléatoire, par exemple en utilisant l'AUC, est-il plus approprié de calculer ces quantités sur les échantillons hors sac ou sur l'ensemble de validation croisée? J'entends que le calculer sur les échantillons OOB donne une évaluation plus pessimiste,...

13
Quelles sont les applications pratiques connues et existantes de la théorie du chaos dans l'exploration de données?

Tout en lisant avec désinvolture certains travaux du marché de masse sur la théorie du chaos au cours des dernières années, j'ai commencé à me demander comment divers aspects de celui-ci pouvaient être appliqués à l'exploration de données et à des domaines connexes, comme les réseaux de neurones,...

13
Expliquer la variance d'un modèle de régression

Cela peut être une explication simple (j'espère quand même). J'ai fait une analyse de régression dans Matlab en utilisant la boîte à outils de régression. Cependant, je suis tombé sur une étude qui dit ceci: "Grâce à l'analyse de régression, il a été possible de mettre en place un modèle prédictif...