Statistiques et Big Data

34
Pourquoi le t-SNE n'est-il pas utilisé comme technique de réduction de la dimensionnalité pour la classification ou le regroupement?

Lors d'une récente mission, il nous a été dit d'utiliser PCA sur les chiffres du MNIST pour réduire les dimensions de 64 (8 x 8 images) à 2. Nous avons ensuite dû regrouper les chiffres à l'aide d'un modèle de mélange gaussien. La PCA n'utilisant que 2 composantes principales ne produit pas de...

33
Comment enseigner aux élèves qui craignent les statistiques?

Je suis sur le point d'aider à enseigner les statistiques aux étudiants en médecine ce semestre. J'ai entendu beaucoup d'histoires d'horreur sur la peur de ces étudiants à partir de statistiques d'apprentissage. Quelqu'un peut-il suggérer quoi faire avec cette peur? (Soit des liens vers des...

33
Comment évaluer la similitude de deux histogrammes?

À partir de deux histogrammes, comment pouvons-nous évaluer s'ils sont similaires ou non? Est-il suffisant de simplement regarder les deux histogrammes? La simple correspondance un à un pose le problème suivant: si un histogramme est légèrement différent et légèrement décalé, nous n'obtiendrons pas...

33
Comment adapter un modèle ARIMAX avec R?

J'ai quatre séries chronologiques différentes de mesures horaires: La consommation de chaleur à l'intérieur d'une maison La température à l'extérieur de la maison Le rayonnement solaire La vitesse du vent Je veux pouvoir prédire la consommation de chaleur à l'intérieur de la maison. Il y a une...

33
Comment former et valider un modèle de réseau neuronal en R?

Je suis novice en modélisation avec les réseaux de neurones, mais j’ai réussi à établir un réseau de neurones avec tous les points de données disponibles qui correspond bien aux données observées. Le réseau de neurones a été réalisé en R avec le paquet nnet: require(nnet) ##33.8 is the highest...