Statistiques et Big Data

8
Pourquoi jamais utiliser la statistique F?

Nous pouvons utiliser la statistique F pour déterminer si au moins l'un des prédicteurs a un effet sur la réponse. Mais pourquoi ne pas prendre une valeur de p minimale pour tous les prédicteurs? Cela ne nécessite pas l'introduction d'un nouveau

8
Covariance pour trois variables

J'essaie de comprendre comment fonctionne la matrice de covariance . Supposons donc que nous ayons deux variables:X, YX,YX, Y, où Cov ( X, Y) = E [ ( x - E [ X] ) ( y- E [ Y] ) ]Cov(X,Y)=E[(x−E[X])(y−E[Y])]\text{Cov}(X,Y) = \mathbb{E}[(x -\mathbb{E}[X])(y-\mathbb{E}[Y])] donne la relation entre les...

8
Arbre de décision avec variable d'entrée continue

Il est connu que lors de la construction d'un arbre de décision, nous divisons la variable d'entrée de manière exhaustive et trouvons la «meilleure» répartition par approche de test statistique ou approche par fonction d'impureté. Ma question est quand nous utilisons une variable continue comme...

8
Séries chronologiques binaires

J'ai une série chronologique binaire: nous avons 2160 données (0 = ne s'est pas produit, 1 = s'est produit) pour une période d'une heure en 90 jours. Je veux prévoir après ces 90 jours, où le prochain 1 se produira, et également étendre cette disposition pour un mois

8
Interprétation des résultats du modèle gam

J'ajuste quelques modèles additifs généralisés en utilisant le mgcvpackage en R, et je veux tester entre deux modèles; si je peux supprimer un terme ou non. Cependant, j'obtiens des résultats contradictoires (pour autant que je sache). Un modèle, m1avec un terme lisse pour xajouté, semble donner un...