Statistiques et Big Data

38
Pourquoi les arbres de décision ne sont-ils pas coûteux en calcul?

Dans Une introduction à l'apprentissage statistique avec applications en R , les auteurs écrivent que l'ajustement d'un arbre de décision est très rapide, mais cela n'a aucun sens pour moi. L'algorithme doit passer en revue toutes les fonctionnalités et les partitionner de toutes les manières...

37
Manuels statistiques Open Source?

Il y a eu quelques questions sur les manuels de statistiques , telles que la question Manuels de statistiques gratuits . Cependant, je suis à la recherche de manuels Open Source, par exemple, sous licence Creative Commons . La raison en est que, dans les supports de cours d'autres domaines, vous...

37
Analyse croisée des séries chronologiques

J'utilise le paquet caret dans R pour créer des modèles prédictifs de classification et de régression. Caret fournit une interface unifiée permettant de régler les hyper-paramètres de modèle par validation croisée ou initialisation. Par exemple, si vous construisez un modèle simple de...

37
Quelles sont les sources de données économiques les plus utiles?

Lors de recherches en économie, il est souvent nécessaire de vérifier les conclusions théoriques sur des données réelles. Quelles sont les sources de données fiables à utiliser et à citer? Je suis principalement intéressé par les sources qui fournissent diverses données statistiques telles que le...