Statistiques et Big Data

20
Les performances de pointe rapportées de l'utilisation de vecteurs de paragraphe pour l'analyse des sentiments ont-elles été reproduites?

J'ai été impressionné par les résultats du document ICML 2014 " Représentations distribuées des peines et des documents " de Le et Mikolov. La technique qu'ils décrivent, appelée «vecteurs de paragraphe», apprend des représentations non supervisées de paragraphes / documents arbitrairement longs,...

20
Regroupement d'une matrice de corrélation

J'ai une matrice de corrélation qui indique comment chaque élément est corrélé à l'autre élément. Donc pour un N items, j'ai déjà une matrice de corrélation N * N. En utilisant cette matrice de corrélation, comment puis-je regrouper les N éléments dans M bacs afin que je puisse dire que les Nk...

20
Exemples concrets de processus décisionnels de Markov

J'ai regardé beaucoup de vidéos tutorielles et elles se ressemblent. Celui-ci par exemple: https://www.youtube.com/watch?v=ip4iSMRW5X4 Ils expliquent les états, les actions et les probabilités qui conviennent. La personne l'explique, mais je n'arrive pas à comprendre à quoi cela pourrait servir...

20
Comment interpréter ces parcelles ACF et PACF

Vous trouverez ci-dessous des graphiques en acf et pacf d'une série de données mensuelles. Le deuxième tracé est acf avec ci.type = 'ma': La persistance de valeurs élevées dans la parcelle acf représente probablement une tendance positive à long terme. La question est de savoir si cela représente...

20
Des manuels sur le calcul matriciel?

Voir cette question sur Math SE . Petite histoire: j'ai lu Les éléments de l'apprentissage statistique et j'ai été frustré lorsque j'essayais de vérifier certains résultats, par exemple, étant donné puis I je cherche un livre de calcul matriciel qui est écrit comme votre livre de calcul...

20
Avons-nous encore besoin de sélectionner des fonctionnalités lors de l'utilisation d'algorithmes de régularisation?

J'ai une question concernant la nécessité d'utiliser des méthodes de sélection d'entités (forêts aléatoires, valeur d'importance des caractéristiques ou méthodes de sélection d'entités univariées, etc.) avant d'exécuter un algorithme d'apprentissage statistique. Nous savons que pour éviter le...