Statistiques et Big Data

10
Log Lik vraisemblance pour GLM

Dans le code suivant, j'effectue une régression logistique sur des données groupées en utilisant glm et "à la main" en utilisant mle2. Pourquoi la fonction logLik dans R me donne-t-elle une vraisemblance logLik (fit.glm) = - 2,336 différente de celle logLik (fit.ml) = - 5,514 que je reçois à la...

10
Quelle est la différence entre la probabilité et la logique floue?

Je travaille avec la logique floue (FL) depuis des années et je sais qu'il existe des différences entre FL et les probabilités concernant en particulier la manière dont FL gère l'incertitude. Cependant, je voudrais demander quelles sont les autres différences entre FL et la probabilité? En d'autres...

10
PyMC pour le regroupement non paramétrique: le processus de Dirichlet pour estimer les paramètres du mélange gaussien ne parvient pas à se regrouper

Configuration du problème L'un des premiers problèmes de jouets auquel j'ai voulu appliquer PyMC est le clustering non paramétrique: étant donné certaines données, modélisez-le comme un mélange gaussien et apprenez le nombre de clusters et la moyenne et la covariance de chaque cluster. La plupart...

10
Arbres de décision: mise à l'échelle variable (fonctionnalité) et normalisation variable (fonctionnalité) (réglage) requises dans quelles implémentations?

Dans de nombreux algorithmes d'apprentissage automatique, la mise à l'échelle des fonctionnalités (aka mise à l'échelle variable, normalisation) est une étape de pré-traitement courante Wikipedia - Mise à l'échelle des fonctionnalités - cette question était proche Question # 41704 - Comment et...

10
Comprendre le hachage des fonctionnalités

Wikipedia fournit l'exemple suivant lors de la description du hachage des fonctionnalités ; mais le mappage ne semble pas cohérent avec le dictionnaire défini Par exemple, todoit être converti en 3fonction du dictionnaire, mais il est codé comme à la 1place. Y a-t-il une erreur dans la description?...

10
Intégration rapide avec eCDF dans R

J'ai une équation intégrale de la forme où est le cdf empirique et est une fonction . J'ai une cartographie de contraction et j'essaie donc de résoudre l'équation intégrale en utilisant la séquence du théorème de Banach Fixed Point.T1(x)=∫x0g(T1(y)) dF^n(y)T1(x)=∫0xg(T1(y)) dF^n(y) T_1(x) =...

10
Classificateur pour une seule classe

Dans une classification simple, nous avons deux classes: classe 0 et classe 1. Dans certaines données, je n'ai que des valeurs pour la classe 1, donc aucune pour la classe 0. Maintenant, je pense à faire un modèle pour modéliser les données pour la classe 1. Ainsi, lorsque de nouvelles données...

10
Je veux montrer

Soit une variable aléatoire sur l'espace des probabilités Montrer queX:Ω→NX:Ω→NX:\Omega \to \mathbb N(Ω,B,P)(Ω,B,P)(\Omega,\mathcal B,P)E(X)=∑n=1∞P(X≥n).E(X)=∑n=1∞P(X≥n).E(X)=\sum_{n=1}^\infty P(X\ge n). ma définition de est égale à E(X)E(X)E(X)E(X)=∫ΩXdP.E(X)=∫ΩXdP.E(X)=\int_\Omega X \, dP....