Statistiques et Big Data

62

La variance d'une somme est-elle égale à la somme des variances?

Est-il vrai (toujours) que Var(∑i=1mXi)=∑i=1mVar(Xi)?Var(∑i=1mXi)=∑i=1mVar(Xi)?\mathrm{Var}\left(\sum\limits_{i=1}^m{X_i}\right) = \sum\limits_{i=1}^m{\mathrm{Var}(X_i)}

variance

62

Bayésiens: esclaves de la fonction de vraisemblance?

Dans son livre "All of Statistics", le professeur Larry Wasserman présente l'exemple suivant (11.10, page 188). Supposons que nous ayons une densité telle que , où est un connu (non négatif, intégrable) la fonction, et la constante de normalisation est inconnu .ffff(x)=cg(x)f(x)=cg(x)f(x)=c\,g(x)c...

bayesian mathematical-statistics

62

Comment tracer un échantillon d'arbre à partir de randomForest :: getTree ()? [fermé]

Tout le monde a des suggestions de code ou de bibliothèque sur la manière de tracer réellement quelques échantillons d’arbres de: getTree(rfobj, k, labelVar=TRUE) (Oui, je sais que vous n’êtes pas censé le faire de manière opérationnelle, RF est une boîte noire, etc., etc. comment bien mes facteurs...

r data-visualization random-forest cart

62

Quelle est la différence entre un réseau de neurones et un réseau de conviction profonde?

J'ai l'impression que lorsque les gens font référence à un réseau de «croyance profonde», il s'agit en réalité d'un réseau de neurones mais de très grande taille. Est-ce correct ou un réseau de conviction profonde implique-t-il également que l'algorithme lui-même est différent (c'est-à-dire, pas de...

machine-learning neural-networks deep-learning deep-belief-networks

62

Pourquoi l'algorithme de clustering k-means utilise-t-il uniquement la métrique de distance euclidienne?

Existe-t-il un objectif spécifique en termes d'efficacité ou de fonctionnalité pour lequel l'algorithme k-means n'utilise pas, par exemple, la similarité cosinus comme métrique de distance, mais ne peut utiliser que la norme euclidienne? En général, la méthode K-means sera-t-elle conforme et...

clustering k-means distance-functions euclidean

61

Où couper un dendrogramme?

La classification hiérarchique peut être représentée par un dendrogramme. Couper un dendrogramme à un certain niveau donne un ensemble de grappes. La coupe à un autre niveau donne un autre ensemble de grappes. Comment choisiriez-vous où couper le dendrogramme? Y at-il quelque chose que nous...

clustering dendrogram

61

Quelle est la différence entre un modèle "imbriqué" et un modèle "non imbriqué"?

Dans la littérature sur les modèles hiérarchiques / multiniveaux, j'ai souvent lu des articles sur les "modèles imbriqués" et les "modèles non imbriqués", mais qu'est-ce que cela signifie? Est-ce que quelqu'un pourrait peut-être me donner des exemples ou me parler des implications mathématiques de...

hypothesis-testing terminology nested-models nested-data

61

Pourquoi seulement trois partitions? (formation, validation, test)

Lorsque vous essayez d'adapter des modèles à un jeu de données volumineux, il est généralement conseillé de partitionner les données en trois parties: le jeu de données d'apprentissage, de validation et de test. En effet, les modèles ont généralement trois "niveaux" de paramètres: le premier...

machine-learning model-selection data-mining

61

Quel problème les méthodes de rétrécissement résolvent-elles?

La saison des vacances m'a donné l'occasion de m'installer près du feu avec Les éléments d'apprentissage statistique . Venant d’une perspective économétrique (fréquentiste), j’ai du mal à comprendre les utilisations de méthodes de réduction telles que la régression de crête, le lasso et la...

lasso ridge-regression shrinkage lars

61

Rapport de vraisemblance vs facteur Bayes

Je suis plutôt évangélique quant à l'utilisation des ratios de vraisemblance pour représenter l'évidence objective de / contre un phénomène donné. Cependant, j’ai récemment appris que le facteur Bayes remplissait une fonction similaire dans le contexte des méthodes bayésiennes (c’est-à-dire que le...

likelihood-ratio bayes-factors

61

Pourquoi le Jeffreys avant est-il utile?

Je comprends que le prior de Jeffreys est invariant sous re-paramétrage. Cependant, ce que je ne comprends pas, c'est pourquoi cette propriété est souhaitée. Pourquoi ne voudriez-vous pas que l’avant change avec un changement de

bayesian prior

61

Comment et pourquoi la normalisation et la mise à l'échelle des fonctionnalités fonctionnent-elles?

Je constate que de nombreux algorithmes d’apprentissage automatique fonctionnent mieux avec une annulation moyenne et une égalisation de covariance. Par exemple, les réseaux de neurones ont tendance à converger plus rapidement et K-Means offre généralement un meilleur clustering avec des...

machine-learning neural-networks covariance normalization

61

Quelle est la relation entre le clustering k-means et PCA?

Il est courant d'appliquer PCA (analyse en composantes principales) avant un algorithme de classification (tel que k-means). On pense que cela améliore les résultats de regroupement dans la pratique (réduction du bruit). Cependant, je suis intéressé par une étude comparative et approfondie de la...

clustering pca k-means

61

Qui a créé la première table normale standard?

Je suis sur le point d'introduire la table normale standard dans mon cours d'introduction aux statistiques et je me suis demandé: qui a créé la première table normale standard? Comment l'ont-ils fait avant l'arrivée des ordinateurs? Je frémis en pensant à une calculatrice en force brute que mille...

normal-distribution algorithms history tables

61

Que signifie "scientifiques se lèvent contre signification statistique"? (Commentaire dans Nature)

Le titre du commentaire dans Nature Les scientifiques se soulèvent contre la signification statistique commence par: Valentin Amrhein, Sander Greenland, Blake McShane et plus de 800 signataires appellent à la fin des revendications excitées et au rejet d'effets potentiellement cruciaux. et plus...

statistical-significance p-value bias

60

Comment visualiser ce que fait ANOVA?

De quelle manière (moyens?) Existe-t-il pour expliquer visuellement ce qu'est l'ANOVA? Toute référence, lien (s) (packages R?) Sera la bienvenue.

data-visualization anova teaching

60

Quels sont les inconvénients de l’utilisation du lasso pour la sélection variable pour la régression?

D'après ce que je sais, utiliser un lasso pour la sélection de variables résout le problème des entrées corrélées. De plus, étant donné qu’elle est équivalente à la régression par le plus petit angle, elle n’est pas lente en calcul. Cependant, beaucoup de personnes (par exemple des personnes que je...

regression feature-selection lasso

60

Que signifie orthogonal dans le contexte des statistiques?

Dans d'autres contextes, orthogonal signifie "à angle droit" ou "perpendiculaire". Que signifie orthogonal dans un contexte statistique? Merci pour toute

descriptive-statistics

60

Comment puis-je m'assurer que les données de test ne fuient pas dans les données d'entraînement?

Supposons que quelqu'un construise un modèle prédictif, mais que quelqu'un ne connaisse pas nécessairement les principes appropriés des statistiques ou de l'apprentissage automatique. Peut-être aidons-nous cette personne dans son apprentissage, ou peut-être utilise-t-elle une sorte de progiciel...

machine-learning classification predictive-models cross-validation out-of-sample

60

Pourquoi l'inclusion de latitude et de longitude dans un GAM explique-t-elle l'autocorrélation spatiale?

J'ai produit des modèles additifs généralisés pour la déforestation. Pour prendre en compte l'autocorrélation spatiale, j'ai inclus latitude et longitude en tant que terme d'interaction lissé (c'est-à-dire s (x, y)). Je me suis basé sur la lecture de nombreux articles dans lesquels les auteurs...

r modeling spatial autocorrelation gam