Statistiques et Big Data

77
Quels sont les "gros problèmes" dans les statistiques?

La mathématique a ses fameux problèmes du millénaire (et, historiquement, les 23 de Hilbert ), des questions qui ont contribué à façonner la direction du terrain. Cependant, je ne sais pas ce que seraient les hypothèses de Riemann et les statistiques P vs NP. Alors, quelles sont les questions...

76
Sélection des fonctionnalités pour le modèle «final» lors de la validation croisée en apprentissage automatique

Je suis un peu confus au sujet de la sélection des fonctionnalités et de l'apprentissage automatique, et je me demandais si vous pouviez m'aider. J'ai un jeu de données de micropuces qui est classé en deux groupes et qui comporte des milliers de fonctionnalités. Mon objectif est d'obtenir un petit...

75
Méthodes de rééchantillonnage / simulation: monte carlo, bootstrapping, jackknifing, validation croisée, tests de randomisation et tests de permutation

J'essaie de comprendre la différence entre différentes méthodes de rééchantillonnage (simulation de Monte Carlo, amorçage paramétrique, amorçage non paramétrique, jackknifing, validation croisée, tests de randomisation et de permutation) et leur mise en œuvre dans mon propre contexte en utilisant...

75
S'il vous plaît expliquer le paradoxe de l'attente

Il y a quelques années, j'ai conçu un détecteur de rayonnement qui fonctionne en mesurant l'intervalle entre les événements plutôt qu'en les comptant. Mon hypothèse était que, lors de la mesure d'échantillons non contigus, je mesurerais en moyenne la moitié de l'intervalle réel. Cependant, lorsque...

74
Diagnostic pour la régression logistique?

Pour la régression linéaire, nous pouvons vérifier les tracés de diagnostic (tracés de résidus, tracés QQ normaux, etc.) pour vérifier si les hypothèses de régression linéaire sont violées. Pour la régression logistique, j'ai du mal à trouver des ressources qui expliquent comment diagnostiquer...

74
Qu'est-ce que la régularisation en anglais simplifié?

Contrairement à d'autres articles, j'ai trouvé l' entrée de Wikipédia sur ce sujet illisible pour une personne non mathématique (comme moi). J'ai compris l'idée de base, à savoir que vous favorisiez les modèles avec moins de règles. Ce que je ne comprends pas, c'est comment passer d'un ensemble de...