Statistiques et Big Data

9
La meilleure façon de regrouper une matrice d'adjacence

J'ai eu du mal à interpréter les grappes résultantes d'une matrice d'adjacence. J'ai 200 matrices relativement grandes représentant des sujets qui contiennent des corrélations partielles (scores z) de séries chronologiques (données neuronales). L'objectif est de regrouper ces 210 matrices et de...

9
Dimension VC d'un rectangle

Le livre "Introduction to Machine learning" d'Ethem Alpaydın déclare que la dimension VC d'un rectangle aligné sur l'axe est 4. Mais comment un rectangle peut-il briser un ensemble de quatre points colinéaires avec des points alternatifs positifs et négatifs ?? Quelqu'un peut-il expliquer et...

9
Dérivation intéressante de R au carré

Il y a des années, j'ai trouvé cette identité par l'expérimentation en jouant avec les données et les transformations. Après l'avoir expliqué à mon professeur de statistique, il est venu dans la classe suivante avec une épreuve d'une page utilisant la notation vectorielle et matricielle....

9
Surajustement du réseau neuronal

J'ai appris qu'un sur-ajustement peut être détecté en traçant l'erreur d'apprentissage et l'erreur de test en fonction des époques. Comme dans: J'ai lu ce blog où ils disent que le réseau neuronal, net5 est trop adapté et ils fournissent ce chiffre: Ce qui est étrange pour moi, car l'erreur de...

9
Interprétation de la causalité de Granger avec R

J'ai trois variables macroéconomiques (ICS - sentiment des consommateurs, ER - taux d'emploi, DGO - commande de biens durables) et j'ai effectué des tests de causalité de Granger en R sur eux. Je ne sais pas vraiment comment interpréter les résultats d'un test de Granger. Quelqu'un pourrait-il...

9
L'échantillonnage basé sur la chaîne de Markov est-il le «meilleur» pour l'échantillonnage de Monte Carlo? Existe-t-il des régimes alternatifs?

Markov Chain Monte Carlo est une méthode basée sur les chaînes de Markov qui nous permet d'obtenir des échantillons (dans un cadre Monte Carlo) à partir de distributions non standard à partir desquelles nous ne pouvons pas prélever directement des échantillons. Ma question est de savoir pourquoi la...

9
Comment tester la médiane d'une population?

J'ai un échantillon de 250 unités. La distribution est asymétrique. Je veux tester une hypothèse selon laquelle la médiane de la population est différente de 3,5, donc je pense qu'un test à un échantillon serait approprié. Je sais que le test de classement de Wilcoxon n'est pas approprié car la...