Statistiques et Big Data

9
Erreur quadratique moyenne ou erreur quadratique moyenne

En tant que locuteur anglais non natif, je me demandais quelle expression carrée ou carrée je devais utiliser. Par exemple , en moyenne carrée erreur ou moyenne au carré erreur. Selon Internet, il semble que les deux formes soient utilisées de manière indistincte. Une expression est-elle plus...

9
Simuler des distributions

Je travaille sur une mission de planification des capacités et j'ai lu quelques livres. Il s'agit spécifiquement des distributions. J'utilise R. Quelle est l'approche recommandée pour identifier ma distribution de données? Existe-t-il des méthodes statistiques pour l'identifier? J'ai ce schéma....

9
Comment puis-je estimer les intervalles de confiance à 95% en utilisant le profilage des paramètres estimés en maximisant une fonction log-vraisemblance en utilisant optim dans R?

Comment puis-je estimer les intervalles de confiance à 95% en utilisant le profilage des paramètres estimés en maximisant une fonction log-vraisemblance en utilisant optim dans R? Je sais que je peux estimer asymptotiquement la matrice de covariance en inversant la toile de jute , mais je crains...

9
Imputation d'une variable censurée

J'ai un ensemble de données médicales avec environ 200 variables. L'une des variables est un bio-marqueur (concentration d'une enzyme particulière). Sa distribution est asymétrique, et le problème est que les valeurs au-dessus d'un certain niveau sont censurées / coupées à ce niveau. Ainsi, alors...

9
Est-il nécessaire de détrôner et de recycler les données de séries chronologiques lors de l'utilisation de méthodes d'apprentissage automatique?

Par exemple: Je veux prévoir les valeurs futures d'une série chronologique sur la base des valeurs précédentes de plusieurs séries chronologiques à l'aide d'un ANN et / ou SVM. Les entrées seront des valeurs décalées de chaque série chronologique, et les sorties seront des prévisions à un pas (les...

9
Si

Disons XXX a une distribution log-normale et il y a un vrai nombre positif ccc. alors est-il juste de dire que( X- c )(X−c)(X -c)a également une distribution log-normale? Mon sentiment est que ça ne peut pas être parce que( X- c )(X−c)(X - c)peut prendre une valeur négative alors qu'une...

9
Certains de mes prédicteurs sont à des échelles très différentes - dois-je les transformer avant d'ajuster un modèle de régression linéaire?

Je voudrais exécuter une régression linéaire sur un ensemble de données multidimensionnelles. Il existe des différences entre les différentes dimensions en termes de leur ordre de grandeur. Par exemple, la dimension 1 a généralement une plage de valeurs de [0, 1] et la dimension 2 a une plage de...