Questions marquées «outliers»

Une valeur aberrante est une observation qui semble inhabituelle ou mal décrite par rapport à une simple caractérisation d'un ensemble de données. Une possibilité déconcertante est que ces données proviennent d'une population différente de celle qui doit être étudiée.

93
Essentiels tests de vérification des données

Dans mon travail, je travaille souvent avec des ensembles de données d'autres personnes. Des non-experts m'apportent des données cliniques et je les aide à les résumer et à effectuer des tests statistiques. Le problème que je rencontre est que les ensembles de données que je suis amené sont presque...

89
Interprétation de plot.lm ()

J'avais une question sur l'interprétation des graphiques générés par plot (lm) dans R. Je me demandais si vous pouviez me dire comment interpréter les tracés de localisation d'échelle et d'effet résiduel? Tous les commentaires seraient appréciés. Assumer des connaissances de base en statistique,...

78
Un exemple: régression LASSO utilisant glmnet pour les résultats binaires

Je commence à me familiariser avec l’utilisation de glmnetavec LASSO Regression, où mon résultat d’intérêt est dichotomique. J'ai créé un petit cadre de données fictif ci-dessous: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99,...

71
Générer une variable aléatoire avec une corrélation définie avec une ou plusieurs variables existantes

Pour une étude de simulation , je dois générer des variables aléatoires qui montrent une corrélation prefined (population) à une variable existante .YYY J'ai examiné les Rpackages copulaet ceux CDVinequi peuvent produire des distributions multivariées aléatoires avec une structure de dépendance...

44
Définition rigoureuse d'une valeur aberrante?

Les gens parlent souvent de faire face aux valeurs aberrantes dans les statistiques. Ce qui me dérange à ce propos, c’est que, pour autant que je sache, la définition d’une valeur aberrante est complètement subjective. Par exemple, si la distribution réelle d'une variable aléatoire est très lourde...

35
Détection des valeurs aberrantes dans les séries chronologiques (LS / AO / TC) à l'aide du paquet tsoutliers en R. Comment représenter les valeurs aberrantes au format équation?

Commentaires: Tout d' abord je voudrais dire un grand merci à l' auteur du nouveau tsoutliers paquet qui met en œuvre de Chen et Liu séries temporelles de détection des valeurs aberrantes qui a été publiée dans le Journal de l'American Statistical Association en 1993 dans le logiciel Open Source...

33
Est-il possible de supprimer les données aberrantes des données?

J'ai cherché un moyen de supprimer les valeurs aberrantes d'un jeu de données et j'ai trouvé cette question . Cependant, dans certains commentaires et réponses à cette question, certaines personnes ont indiqué qu’il était de mauvaise pratique de supprimer les données aberrantes des données. Dans...

27
Détection des valeurs aberrantes à l'aide des écarts-types

Suite à ma question ici , je me demande s'il existe des opinions bien arrêtées pour ou contre l'utilisation de l'écart-type pour détecter les valeurs aberrantes (par exemple, tout point de données supérieur à 2 écarts-types est une valeur aberrante). Je sais que cela dépend du contexte de l'étude,...