Statistiques et Big Data

10
La médiane est-elle une propriété «métrique» ou «topologique»?

Je m'excuse du léger abus de terminologie; J'espère qu'il deviendra clair ce que je veux dire ci-dessous. Considérons une variable aléatoire . La moyenne et la médiane peuvent toutes deux être caractérisées par un critère d'optimalité: la moyenne est le nombre qui minimise , et la médiane ce nombre...

10
Références: Queue du cdf inverse

Je suis presque sûr d'avoir déjà vu le résultat suivant dans les statistiques mais je ne me souviens pas où. Si est une variable aléatoire positive et alors lorsque , où est le cdf de .E ( X ) < ∞ ε F - 1 ( 1 - ε ) → 0 ε → 0 + F

10
Distinguer les effets à court terme et à long terme

J'ai lu dans un journal la phrase suivante: Le fait qu'il existe une différence entre les coefficients à court terme et à long terme est le résultat de notre spécification qui inclut des variables endogènes décalées. Ils effectuent une régression des premières différences et incluent un décalage de...

10
Comment éviter le terme log (0) en régression

J'ai les vecteurs X et Y simples suivants: > X [1] 1.000 0.063 0.031 0.012 0.005 0.000 > Y [1] 1.000 1.000 1.000 0.961 0.884 0.000 > > plot(X,Y) Je veux faire une régression en utilisant le journal de X. Pour éviter d'obtenir le journal (0), j'essaie de mettre +1 ou +0,1 ou +0,00001 ou...

10
Qu'est-ce que la bucketisation?

J'ai fait le tour pour trouver une explication claire de la «bucketisation» dans l'apprentissage automatique sans succès. Ce que je comprends jusqu'à présent, c'est que la bucketisation est similaire à la quantification dans le traitement numérique du signal où une plage de valeurs continues est...