Statistiques et Big Data

11

Représentation dans l'espace d'états d'ARMA (p, q) de Hamilton

J'ai lu le chapitre 13 de Hamilton et il a la représentation de l'espace d'état suivante pour un ARMA (p, q). Soit .Puis le processus ARMA (p, q) est le suivant: \ begin {aligné} y_t - \ mu & = \ phi_1 (y_ {t-1} - \ mu) + \ phi_2 (y_ {t-2} - \ mu) + ... + \ phi_3 (y_ {t-3} - \ mu) \\ & + \...

11

De meilleures performances en utilisant Random Forest one-Vs All que Random Forest multiclass?

Je travaille sur un problème multiclasse avec 9 labels possibles, pour lesquels j'ai un jeu de données composé de ~ 50 000 exemples et ~ 200 fonctionnalités chacun. Chaque exemple ne peut appartenir qu'à une seule classe. Les données sont assez équilibrées entre les différentes étiquettes. Compte...

random-forest scikit-learn multi-class

11

Inférence variationnelle en anglais simple

Après avoir regardé des vidéos sur YouTube, j'ai l'impression que je ne peux pas vraiment définir ce qu'est l'inférence variationnelle. Je peux suivre les procédures pendant que je regarde les conférences vidéo à ce sujet. Mais difficile de définir ce qui est vraiment. J'espère en entendre...

machine-learning mathematical-statistics data-mining

11

Lire des parcelles en boîte et moustaches: est-il possible de glaner des différences significatives entre les groupes?

Supposons que nous examinions ce complot en boîte et moustaches: Entre jeudi et vendredi, je pense que la plupart conviendraient qu'il semble y avoir une différence significative dans le temps passé à dormir. Est-ce une conjecture statistiquement valable, cependant? Pouvons-nous discerner des...

anova data-visualization boxplot

11

Pouvons-nous accepter la valeur nulle dans les tests de non-infériorité?

Dans un test t moyen des moyens, en utilisant les méthodes habituelles de test d'hypothèse, nous rejetons le nul ou ne le rejetons pas mais nous n'acceptons jamais le nul. Une des raisons à cela est que si nous obtenions plus de preuves, la même taille d'effet deviendrait significative. Mais que se...

hypothesis-testing tost non-inferiority

11

Comment interpréter les résultats lorsque la crête et le lasso fonctionnent bien séparément mais produisent des coefficients différents

J'utilise un modèle de régression avec Lasso et Ridge (pour prédire une variable de résultat discrète allant de 0 à 5). Avant d'exécuter le modèle, j'utilise la SelectKBestméthode de scikit-learnpour réduire l'ensemble de fonctionnalités de 250 à 25 . Sans sélection initiale des caractéristiques,...

regression predictive-models feature-selection lasso ridge-regression

11

La multicolinéarité est-elle vraiment un problème?

Je travaille sur un projet de modélisation prédictive ces jours-ci: essayer d'apprendre un modèle et faire des prédictions en temps réel sur la base du modèle que j'ai appris hors ligne. J'ai commencé à utiliser la régression de crête récemment, car j'ai lu que la régularisation peut aider à...

regression prediction multicollinearity ridge-regression

11

Dois-je signaler des résultats non significatifs?

J'ai exécuté un test de Kruskal Wallis, et pour certaines des questions, la valeur p n'est pas significative. Dois-je le signaler de la même manière que s'il était significatif, en indiquant le df, la statistique de test et la valeur de p? Donc, ce serait quelque chose comme ça, un test de Kruskal...

spss kruskal-wallis reporting

11

La moyenne géométrique est un estimateur non biaisé de la moyenne de quelle distribution continue?

Existe-t-il une distribution continue exprimable sous forme fermée, dont la moyenne est telle que la moyenne géométrique des échantillons est un estimateur non biaisé de cette moyenne? Mise à jour: Je viens de réaliser que mes échantillons doivent être positifs (ou bien la moyenne géométrique peut...

distributions geometric-mean

11

CIFAR-10 Impossible d'obtenir une précision supérieure à 60%, Keras avec le backend Tensorflow [fermé]

Fermé. Cette question est hors sujet . Il n'accepte pas actuellement les réponses. Vous souhaitez améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé l'année dernière . La formation après 15 époques sur l'ensemble de données CIFAR-10...

neural-networks conv-neural-network keras

11

Quelle est la différence entre le modèle déterministe et le modèle stochastique?

Modèle linéaire simple: x=αt+ϵtx=αt+ϵtx=\alpha t + \epsilon_t où ~ iid N ( 0 , σ 2 )ϵtϵt\epsilon_tN(0,σ2)N(0,σ2)N(0,\sigma^2) avec etV a r ( x ) = σ 2E(x)=αtE(x)=αtE(x) = \alpha tVar(x)=σ2Var(x)=σ2Var(x)=\sigma^2 AR (1): Xt=αXt−1+ϵtXt=αXt−1+ϵtX_t =\alpha X_{t-1} + \epsilon_t où ~ iid N ( 0 , σ 2...

regression stochastic-processes autoregressive deterministic

11

Pourquoi Netflix passerait-il de son système de notation à cinq étoiles à un système de j'aime / n'aime pas?

Netflix avait l'habitude de baser ses suggestions sur les évaluations soumises par un utilisateur d'autres films / émissions. Ce système de notation avait cinq étoiles. Désormais, Netflix permet aux utilisateurs d'aimer / détester (pouce levé / pouce baissé) les films / émissions. Ils affirment...

variance predictive-models prediction

11

Quelle est la perte de poids?

Je commence par l'apprentissage en profondeur, et j'ai une question dont je n'ai pas trouvé la réponse, peut-être que je n'ai pas cherché correctement. J'ai vu cette réponse , mais on ne sait toujours pas quelle est la perte de perte de poids et comment est-elle liée à la fonction de...

neural-networks conv-neural-network

11

Pointe et dalle bayésienne versus méthodes pénalisées

Je lis les diapositives de Steven Scott sur le package BSTS R (vous pouvez les trouver ici: diapositives ). À un moment donné, lorsqu'il parle d'inclure de nombreux régresseurs dans le modèle de série chronologique structurelle, il présente les a priori de pointe et de dalle des coefficients de...

r bayesian feature-selection penalized bsts

11

Quand utiliser le modèle à effets mixtes?

Les modèles d'effets mixtes linéaires sont des extensions des modèles de régression linéaire pour les données collectées et résumées en groupes. Les principaux avantages sont que les coefficients peuvent varier par rapport à une ou plusieurs variables de groupe. Cependant, je me bats avec quand...

regression mixed-model random-effects-model linear

11

Flèches des variables sous-jacentes dans le biplot PCA dans R

Au risque de rendre la question spécifique au logiciel, et avec l'excuse de son ubiquité et de ses idiosyncrasies, je veux poser des questions sur la fonction biplot()dans R, et, plus précisément, sur le calcul et le tracé de sa valeur par défaut, des flèches rouges superposées, correspondant aux...

r pca biplot

11

Que faites-vous si vos degrés de liberté dépassent la fin de vos tables?

Les degrés de liberté dans ma table F ne montent pas assez haut pour mon gros échantillon. Par exemple, si j'ai un F avec 5 et 6744 degrés de liberté, comment puis-je trouver la valeur critique de 5% pour une ANOVA? Et si je faisais un test du chi carré avec de grands degrés de liberté? [Une...

chi-squared degrees-of-freedom f-distribution tables

11

Avantages et inconvénients du bootstrapping

Je viens d'apprendre le concept de bootstrap, et une question naïve m'est venue à l'esprit: si nous pouvons toujours générer de nombreux échantillons bootstrap de nos données, pourquoi se donner la peine d'obtenir davantage de données "réelles"? Je pense avoir une explication, dites-moi si j'ai...

variance bootstrap bias

11

Poids aléatoire de la forêt et de la classe

Question en une phrase: quelqu'un sait-il comment déterminer les bons poids de classe pour une forêt aléatoire? Explication: je joue avec des jeux de données déséquilibrés. Je veux utiliser le Rpackage randomForestpour former un modèle sur un ensemble de données très asymétrique avec seulement de...

r random-forest

11

L'information mutuelle comme probabilité

Pourrait l'information mutuelle sur l'entropie conjointe: 0≤I(X,Y)H(X,Y)≤10≤I(X,Y)H(X,Y)≤1 0 \leq \frac{I(X,Y)}{H(X,Y)} \leq 1 être défini comme: "La probabilité de transmettre une information de X à Y"? Je suis désolé d'être si naïf, mais je n'ai jamais étudié la théorie de l'information, et...

information-theory mutual-information