Statistiques et Big Data

12
L'optimisation PCA est-elle convexe?

La fonction objective de l'analyse en composantes principales (ACP) minimise l'erreur de reconstruction dans la norme L2 (voir la section 2.12 ici . Une autre vue essaie de maximiser la variance sur la projection. Nous avons également un excellent article ici: Quelle est la fonction objective de...

12
Résumé d'un ajustement GAM

Si nous adaptons un GAM comme: gam.fit = gam::gam(Outstate ~ Private + s(Room.Board, df = 2) + s(PhD, df = 2) + s(perc.alumni, df = 2) + s(Expend, df = 5) + s(Grad.Rate, df = 2), data = College) Où, nous utilisons l'ensemble de données College, qui peut être trouvé à l'intérieur du package ISLR....

12
Les root sont-elles recommandées?

Mon collègue veut analyser certaines données après avoir transformé la variable de réponse en la portant à la puissance de (c'est-à-dire ).1818\frac18y0.125y0.125y^{0.125} Je suis mal à l'aise avec cela, mais j'ai du mal à expliquer pourquoi. Je ne peux penser à aucune justification mécanique de...

12
RMSProp et Adam vs SGD

J'exécute des expériences sur l'ensemble de validation EMNIST en utilisant des réseaux avec RMSProp, Adam et SGD. J'atteins une précision de 87% avec SGD (taux d'apprentissage de 0,1) et décrochage (0,1 décrochage prob) ainsi que la régularisation L2 (pénalité 1e-05). En testant la même...

12
Quelle est la relation entre l'ANOVA pour comparer les moyennes de plusieurs groupes et l'ANOVA pour comparer les modèles imbriqués?

Jusqu'à présent, j'ai vu l'ANOVA utilisée de deux manières: Premièrement , dans mon texte d'introduction aux statistiques, l'ANOVA a été présentée comme un moyen de comparer les moyennes de trois groupes ou plus, comme une amélioration par rapport à la comparaison par paires, afin de déterminer si...

12
Le chercheur 1 exécute 1000 régressions, le chercheur 2 exécute seulement 1, les deux obtiennent les mêmes résultats - devraient-ils faire des inférences différentes?

Imaginez qu'un chercheur explore un ensemble de données et exécute 1000 régressions différentes et qu'il trouve entre elles une relation intéressante. Imaginez maintenant qu'un autre chercheur avec les mêmes données exécute une seule régression, et il s'avère que c'est le même que l'autre chercheur...

12
Est-il possible que deux variables aléatoires d'une même famille de distribution aient la même attente et variance, mais des moments supérieurs différents?

Je pensais à la signification de la famille à l'échelle de l'emplacement. Je crois comprendre que pour chaque XXX membre d'un emplacement famille à grande échelle avec des paramètres emplacement et échelle, la distribution de ne dépend pas de tous les paramètres et il est le même pour tous...

12
Problèmes de causalité de Judea Pearl Book

Je commence à lire Causal Inference in Statistics, A Primer de Judea Pearl et. Al. J'ai une maîtrise en mathématiques, mais je n'ai jamais suivi de cours de statistique. Je suis un peu confus par l'une des premières questions de l'étude, et je ne peux poser aucune question à ce sujet, alors...