Existe-t-il de bons articles ou livres traitant de l'utilisation de la descente coordonnée pour L1 (lasso) et / ou de la régularisation nette élastique pour les problèmes de régression
Existe-t-il de bons articles ou livres traitant de l'utilisation de la descente coordonnée pour L1 (lasso) et / ou de la régularisation nette élastique pour les problèmes de régression
Si est distribué de façon exponentielle (i = 1, ..., n) avec le paramètre \ lambda et que les X_i sont mutuellement indépendants, quelle est l'attente de ( i = 1 , . . . , N ) λ X iXiXiX_i(i=1,...,n)(i=1,...,n)(i=1,...,n)λλ\lambdaXiXiX_i (∑i=1nXi)2(∑i=1nXi)2 \left(\sum_{i=1}^n {X_i} \right)^2 en...
En tant que titre, je dois dessiner quelque chose comme ceci: Est-ce que ggplot, ou d'autres packages si ggplot n'est pas capable, peut être utilisé pour dessiner quelque chose comme
Quand je dis à mes amis non statistiques que je suis un étudiant diplômé poursuivant un doctorat en statistique, ils disent naturellement "oh alors tu veux être professeur?". Je leur dis que non, je compte travailler dans l'industrie. Puis ils répondent par "et quoi faire?". Je n'ai pas trouvé de...
Existe-t-il un moyen de principe d'estimer les scores des facteurs lorsque vous avez des variables ordinales discrètes. J'ai variables ordinales, discrètes. Si je fais l'hypothèse que chaque réponse est sous-jacente à une variable continue, normalement distribuée, alors je peux calculer une matrice...
La bibliothèque languageR fournit une méthode (pvals.fnc) pour effectuer des tests de signification MCMC des effets fixes dans un modèle de régression à effets mixtes à l'aide de lmer. Cependant, pvals.fnc donne une erreur lorsque le modèle lmer inclut des pentes aléatoires. Existe-t-il un moyen de...
J'examine la survie médiane en utilisant Kaplan-Meier dans différents états pour un type de cancer. Il existe de grandes différences entre les États. Comment puis-je comparer la survie médiane entre tous les États et déterminer lesquels sont significativement différents de la survie médiane moyenne...
Les SVM pour la classification ont un sens intuitif pour moi: je comprends comment minimiser donne la marge maximale. Cependant, je ne comprends pas cet objectif dans le contexte de la régression. Divers textes ( ici et ici ) décrivent cela comme maximisant la «planéité». Pourquoi voudrions-nous...
J'ai 12 ensembles d'entraînement positifs (cellules cancéreuses traitées avec des médicaments avec chacun des 12 mécanismes d'action différents). Pour chacun de ces ensembles d'entraînement positifs, je voudrais former une machine à vecteur de support pour la distinguer d'un ensemble négatif de...
Je fais un modèle d'élimination rétrograde simple basé sur AIC où certaines variables sont des variables catégorielles à plusieurs niveaux. Ces variables sont modélisées comme un ensemble de variables fictives. Lors d'une élimination en amont, dois-je supprimer tous les niveaux d'une variable...
Contexte: Je suis un programmeur avec une expérience (à moitié oubliée) en statistiques de cours uni. Récemment, je suis tombé sur http://akinator.com et j'ai passé un certain temps à essayer de le faire échouer. Et qui ne l'était pas? :) J'ai décidé de découvrir comment cela pouvait fonctionner....
Toujours en train d'apprendre les fonctions de base dans R, la fonction de sous-ensemble semble filtrer uniquement une condition basée sur une seule colonne avec ou sans plusieurs conditions? Comment filtrer facilement les données d'une trame de données? lorsque plusieurs conditions vous sont...
Je lisais un article et j'ai vu un tableau avec une comparaison entre PPV (Positive Predictive Value) et NPV (Negative Predictive Value). Ils ont fait une sorte de test statistique pour eux, voici un croquis du tableau: PPV NPV p-value 65.9 100 < 0.00001 ... Chaque ligne fait référence à un...
Il semble que vous puissiez utiliser le codage pour une variable catégorielle, mais j'ai deux variables prédictives catégoriques et une variable prédictive continue. Puis-je utiliser la régression multiple pour cela dans SPSS et si oui, comment?
Il y a une variable dans mes données qui ont 80% de données manquantes. Les données sont manquantes en raison de leur inexistence (c'est-à-dire du montant du prêt bancaire que l'entreprise doit). Je suis tombé sur un article disant que la méthode d'ajustement variable factice est la solution à ce...
Il existe de nombreuses méthodes d'estimation des paramètres. MLE, UMVUE, MoM, décision-théorique, et d'autres semblent tous avoir un cas assez logique pour expliquer pourquoi ils sont utiles pour l'estimation des paramètres. Une méthode est-elle meilleure que les autres, ou s'agit-il simplement de...
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 3 ans . Il y a quelques jours, j'ai vu un article sur la façon de configurer un...
Comment puis-je tester les effets dans une ANOVA Split-Plot en utilisant des comparaisons de modèles appropriées à utiliser avec les arguments Xet Mde anova.mlm()dans R? Je connais bien ?anova.mlmDalgaard (2007) [1]. Malheureusement, il ne brosse que les conceptions Split-Plot. Faire cela dans une...
Le contexte J'ai deux ensembles de données que je veux comparer. Chaque élément de données dans les deux ensembles est un vecteur contenant 22 angles (tous entre et ). Les angles se rapportent à une configuration de pose humaine donnée, donc une pose est définie par 22 angles communs.π−π−π-\piππ\pi...
Cela a été inspiré par la régression linéaire en ligne efficace , que j'ai trouvée très intéressante. Existe-t-il des textes ou des ressources consacrés au calcul statistique à grande échelle, par lesquels le calcul avec des ensembles de données trop volumineux pour tenir dans la mémoire...