Statistiques et Big Data

12
Comment utiliser auto.arima pour imputer des valeurs manquantes

J'ai une série zoo avec de nombreuses valeurs manquantes. J'ai lu que cela auto.arimapeut imputer ces valeurs manquantes? Quelqu'un peut-il m'apprendre à le faire? Merci beaucoup! C'est ce que j'ai essayé, mais sans succès: fit <- auto.arima(tsx) plot(forecast(fit))

12
Comprendre les résultats de l'analyse de médiation dans R

J'essaie de comprendre le package de médiation dans R, en utilisant la vignette du package. J'ai du mal à comprendre la sortie de la mediate()fonction. require("mediation") require("sandwich") data("framing") med.fit <- lm(emo ~ treat + age + educ + gender + income, data = framing) out.fit <-...

12
Quel test statistique utiliser pour le test A / B?

Nous avons deux cohortes de 1000 échantillons chacune. Nous mesurons 2 quantités sur chaque cohorte. Le premier est une variable binaire. Le second est un nombre réel qui suit une distribution de queue lourde. Nous voulons évaluer la cohorte la plus performante pour chaque métrique. Il existe de...

12
Bonne forme pour éliminer les valeurs aberrantes?

Je travaille sur les statistiques des builds de logiciels. J'ai des données pour chaque build sur réussite / échec et le temps écoulé et nous générons ~ 200 de ces / semaine. Le taux de réussite est facile à agréger, je peux dire que 45% ont réussi une semaine donnée. Mais je voudrais également...

12
Comment trouver un intervalle de prédiction GBM

Je travaille avec des modèles GBM en utilisant le package caret et cherche à trouver une méthode pour résoudre les intervalles de prédiction pour mes données prédites. J'ai beaucoup cherché, mais je n'ai trouvé que quelques idées pour trouver des intervalles de prédiction pour Random Forest. Tout...

12
Normes Ridge & LASSO

Cet article suit celui-ci: pourquoi l'estimation des crêtes devient-elle meilleure que l'OLS en ajoutant une constante à la diagonale? Voici ma question: Pour autant que je sache, la régularisation des crêtes utilise une norme ℓ2ℓ2\ell_2 (distance euclidienne). Mais pourquoi utilisons-nous le carré...