Statistiques et Big Data

10
Régularisation: pourquoi multiplier par 1 / 2m?

Dans les notes de cours de la semaine 3 du cours Coursera Machine Learning d' Andrew Ng , un terme est ajouté à la fonction de coût pour implémenter la régularisation: J+(θ)=J(θ)+λ2m∑j=1nθ2jJ+(θ)=J(θ)+λ2m∑j=1nθj2J^+(\theta) = J(\theta) + \frac{\lambda}{2m} \sum_{j=1}^n \theta_j^2 Les notes de cours...

10
Différence entre Outlier et Inlier

Je suis tombé sur le terme inlier dans la mesure LOF (Local Outlier Factor), je connais bien le terme de valeurs aberrantes (enfin essentiellement des menteurs - des instances qui ne se comportent pas comme les autres instances). Que signifie «Inliers» dans le contexte de la détection d'anomalies?...

10
Si

Pour une variable aléatoire continue XXX , si E(|X|)E(|X|)E(|X|) est fini, est-ce que limn→∞nP(|X|>n)=0limn→∞nP(|X|>n)=0\lim_{n\to\infty}n P(|X|>n)=0 ? C'est un problème que j'ai trouvé sur Internet, mais je ne sais pas s'il tient ou non. Je sais que

10
Qu'est-ce que la programmation probabiliste?

Au cours de la dernière année, j'ai beaucoup entendu parler des cadres de programmation probabiliste (PP) comme PyMC3 et Stan , et de la qualité de PP. Et aujourd'hui, quelqu'un a partagé ce lien avec moi: Pyro: un langage de programmation probabiliste profond Cependant, je ne suit pas vraiment ce...

10
Preuve facile de ?

Soit des variables aléatoires normales standard indépendantes. Il existe de nombreuses (longues) preuves, montrant queZ1,⋯,ZnZ1,⋯,ZnZ_1,\cdots,Z_n ∑i=1n(Zi−1n∑j=1nZj)2∼χ2n−1∑i=1n(Zi−1n∑j=1nZj)2∼χn−12 \sum_{i=1}^n \left(Z_i - \frac{1}{n}\sum_{j=1}^n Z_j \right)^2 \sim \chi^2_{n-1} De nombreuses...

10
Le théorème du contraste relatif de Beyer et al. papier: «Sur le comportement surprenant des métriques de distance dans l'espace de grande dimension» trompeur?

Ceci est cité très souvent en mentionnant la malédiction de la dimensionnalité et va (formule de droite appelée contraste relatif) limré→ ∞var ( | | Xré| |kE[ | | Xré| |k]) =0,alors: Dmaxkré- Dminkréréminkré→ 0limré→∞var(||Xré||kE[||Xré||k])=0,alors:rémaxrék-réminrékréminrék→0 \lim_{d\rightarrow...

10
Le Paradoxe de Simpson couvre-t-il toutes les instances de retournement d'une variable cachée?

Ce qui suit est une question sur les nombreuses visualisations offertes comme «preuve par l'image» de l'existence du paradoxe de Simpson, et peut-être une question sur la terminologie. Le Paradoxe de Simpson est un phénomène assez simple à décrire et à donner des exemples numériques (la raison pour...