Statistiques et Big Data

8
Can soit supérieur à 1?

La page Wikipedia sur R2 dit que peut prendre une valeur supérieure à 1. Je ne vois pas comment cela est possible.R2R2R^2 Des valeurs de R2R2R^2 dehors de la plage de 0 à 1 peuvent apparaître lorsqu'elles sont utilisées pour mesurer l'accord entre les valeurs observées et modélisées et lorsque les...

8
Sélection adaptative du nombre de répliques bootstrap

Comme pour la plupart des méthodes Monte Carlo, la règle de bootstrap est que plus le nombre de répliques est élevé, plus l'erreur Monte Carlo est faible. Mais les rendements diminuent, il n'est donc pas logique d'exécuter autant de répliques que possible. Supposons que vous vouliez vous assurer...

8
Des inconvénients du filet élastique par rapport au lasso?

Quels sont les inconvénients de l'utilisation d'un filet élastique par rapport au lasso. Je sais que le filet élastique est capable de sélectionner des groupes de variables lorsqu'ils sont fortement corrélés. Il n'a pas le problème de sélectionner plus de nnnprédicteurs lorsque . Alors que le lasso...

8
Forêt aléatoire dans un cadre Big Data

J'ai un ensemble de données avec 5 818 446 lignes et 51 colonnes, dont 50 sont des prédicteurs. Ma réponse est quantitative, je suis donc intéressé par un modèle de régression. J'essaie d'adapter une forêt aléatoire à mes données en utilisant le package caret. Cependant, je n'ai pas assez de RAM...

8
comparaison de groupes dans des modèles FE à mesures répétées, avec une composante d'erreur imbriquée, estimée à l'aide de plm

J'ai estimé des modèles à effets fixes de mesures répétées, avec une composante d'erreur imbriquée, en me basant sur des variables de regroupement, c'est-à-dire des modèles non imbriqués, en utilisant plm. Je suis maintenant intéressé à tester si les modèles complets sont significativement...