Statistiques et Big Data

10
Problèmes de pièges variables factices

J'exécute une grande régression OLS où toutes les variables indépendantes (environ 400) sont des variables fictives. Si tous sont inclus, il y a une parfaite multicolinéarité (le piège variable factice), donc je dois omettre l'une des variables avant d'exécuter la régression. Ma première question...

10
Génération de vecteurs aléatoires avec contraintes

J'ai besoin de créer des vecteurs aléatoires de nombres réels a_i satisfaisant aux contraintes suivantes: abs(a_i) < c_i; sum(a_i)< A; # sum of elements smaller than A sum(b_i * a_i) < B; # weighted sum is smaller than B aT*A*a < D # quadratic multiplication with A smaller than D where...

10
Choisissez le niveau de facteur comme base factice en lm () en R

Disons que je régresse Y sur X1 et X2, où X1 est une variable numérique et X2 est un facteur à quatre niveaux (A: D). Existe-t-il un moyen d'écrire la fonction de régression linéaire lm(Y ~ X1 + as.factor(X2))afin que je puisse choisir un niveau particulier de X2 - disons, B - comme ligne de...

10
Combiner les probabilités d'accidents nucléaires

Les récents événements au Japon m'ont fait penser à ce qui suit. Les centrales nucléaires sont généralement conçues pour limiter le risque d'accidents graves à une «probabilité de référence», par exemple 10E-6 / an. Ce sont les critères d'une seule usine. Cependant, lorsqu'il y a une population de...

10
Parallélisation du paquet caret à l'aide de doSMP

MISE À JOUR: caret utilise désormais en foreachinterne, donc cette question n'est plus vraiment pertinente. Si vous pouvez enregistrer un backend parallèle fonctionnel foreach, caret l'utilisera. J'ai le package caret pour R, et je suis intéressé par l'utilisation de la trainfonction pour effectuer...

10
Encyclopédie graphique

Je dois créer une application Web multi-utilisateurs qui concerne les mesures de trafic, les pronostics, etc. À ce stade, je sais que j'utiliserai des graphiques à barres et à secteurs. Malheureusement, ces types de graphiques ne sont pas riches en expression de toutes les données que je collecte...

10
Importance des coefficients de régression (GAM) lorsque la vraisemblance du modèle n'est pas significativement plus élevée que nulle

J'exécute une régression basée sur GAM en utilisant le gamlss du package R et en supposant une distribution bêta gonflée à zéro des données. Je n'ai qu'une seule variable explicative dans mon modèle, il est donc essentiellement: mymodel = gamlss(response ~ input, family=BEZI). L'algorithme me donne...

10
Est-il possible d'intégrer analytiquement

Premièrement, en intégrant analytiquement, je veux dire, existe-t-il une règle d'intégration pour résoudre ce problème par opposition aux analyses numériques (telles que les règles trapézoïdales, Gauss-Legendre ou Simpson)? J'ai une fonction où g ( x ; μ , σ ) = 1F( x ) = x g( x ; μ ,...