Statistiques et Big Data

20
AdaBoost est-il moins ou plus sujet au sur-ajustement?

J'ai lu diverses déclarations (apparemment) contradictoires, que AdaBoost (ou d'autres techniques de boosting) soient ou non sujettes à un sur-ajustement par rapport à d'autres méthodes d'apprentissage. Y a-t-il de bonnes raisons de croire l'un ou l'autre? Si cela dépend, de quoi dépend-il? Quelles...

20
Modification de l'échelle d'une variable à 0-100

J'ai construit un indice de capital social en utilisant la technique PCA. Cet indice comprend des valeurs à la fois positives et négatives. Je veux transformer / convertir cet index en échelle 0-100 pour le rendre facile à interpréter. Veuillez me suggérer un moyen le plus simple de le...

20
«Entièrement bayésien» vs «Bayésien»

J'ai appris les statistiques bayésiennes et j'ai souvent lu des articles "nous adoptons une approche bayésienne" ou quelque chose de similaire. J'ai aussi remarqué, moins souvent: "nous adoptons une approche entièrement bayésienne" (c'est moi qui souligne). Y a-t-il une différence entre ces...

20
PCA de données non gaussiennes

J'ai quelques questions rapides sur PCA: L'ACP suppose- t-elle que l'ensemble de données est gaussien? Que se passe-t-il lorsque j'applique une PCA à des données intrinsèquement non linéaires? Étant donné un ensemble de données, le processus consiste d'abord à normaliser la moyenne, à définir la...

20
Intuition statistique / sens des données

Je suis un étudiant de deuxième année de premier cycle, étudiant en mathématiques, et j'ai parlé à l'un de mes professeurs de la différence entre la capacité mathématique et la capacité statistique. L'une des principales différences qu'il a évoquées est le «sens des données» qu'il a expliqué comme...