Questions marquées «data-visualization»

46
Interprétation du prédicteur et / ou de la réponse transformé par log

Je me demande si cela fait une différence d'interprétation si seules les variables dépendantes, indépendantes et dépendantes, ou uniquement les variables indépendantes sont transformées par un journal. Considérons le cas de log(DV) = Intercept + B1*IV + Error Je peux interpréter l'IV comme...

45
Comment tracer correctement les tendances

Je crée un graphique pour montrer les tendances des taux de mortalité (pour 1 000 personnes) dans différents pays et l'histoire qui devrait résulter de l'intrigue est que l'Allemagne (ligne bleu clair) est le seul dont la tendance est à la hausse après 1932. C'est mon premier essai (basique) À mon...

44
Quel est votre graphique statistique préféré?

C'est l'un de mes favoris Cet exemple est dans une veine humoristique (Steven Gortmaker, ancien professeur à moi), mais je suis également intéressé par les graphiques que vous sentez magnifiquement capturer et communiquer une idée statistique ou une méthode, ainsi que vos idées à ce sujet. Une...

37
Quand le t-SNE est-il trompeur?

Citant l'un des auteurs: L'intégration de voisins stochastiques t-distribués (t-SNE) est une technique ( primée ) de réduction de dimensionnalité particulièrement bien adaptée à la visualisation de jeux de données de grande dimension. Cela semble donc très bien, mais c'est l'auteur qui parle. Une...

34
Pourquoi y a-t-il une différence entre le calcul manuel d'un intervalle de confiance de 95% selon la régression logistique et l'utilisation de la fonction confint () dans R?

Cher tout le monde - J'ai remarqué quelque chose d'étrange que je ne peux pas expliquer, pouvez-vous? En résumé: l'approche manuelle pour calculer un intervalle de confiance dans un modèle de régression logistique et la fonction R confint()donnent des résultats différents. Je suis passé par la...