Quels sont les choix populaires pour visualiser des données en 4 dimensions?

12

Disons que j'ai les données à quatre dimensions suivantes, où les trois premières peuvent être considérées comme des coordonnées et la dernière peut être considérée comme des valeurs.

c1, c2, c3, value
1, 2, 6, 0.456
34, 34, 12 0.27
12, 1, 66 0.95

Comment mieux visualiser l'effet des trois premières coordonnées sur la dernière valeur?

Je connais trois méthodes.

L'un est un tracé 3D pour les trois premières coordonnées avec la taille des points comme valeur à quatre. Mais il n'est pas si facile de voir la tendance dans les données.

Un autre utilise une série de tracés 3D, chacun avec une coordonnée fixe. entrez la description de l'image ici

Un autre peut être un soi-disant "graphes en treillis" en treillis de R. Pas sur eif, il est à cette fin, mais il semble que oui. entrez la description de l'image ici

Tyler 傲 来 国 主
la source
2
Avez-vous besoin d'un affichage statique (par exemple, pour un papier)?
gung - Rétablir Monica

Réponses:

12

Si les trois premiers ne sont que des coordonnées spatiales et que les données sont rares, vous pouvez simplement faire un nuage de points 3D avec des points de tailles ou de couleurs différentes pour la valeur.

Ressemble à quelque chose comme ceci: (source: gatech.edu )Dispersion

Si vos données sont destinées à être de nature continue et existent sur une grille en treillis, vous pouvez tracer plusieurs isocontours des données à l'aide de Marching Cubes .

Une autre approche lorsque vous avez des données 4D denses est d'afficher plusieurs "tranches" 2D des données incorporées en 3D. Cela ressemblera à ceci:

Tranches

mklingen
la source
Le nuage de points 3D coloré ne convient que pour les fonctions continues sur les données 3D. Si le gradient de la fonction change en douceur, vous pouvez voir un motif à travers la dispersion des points. De même, la visualisation du volume en bas fonctionne mieux dans ce scénario également. Si la fonction est très bruyante, vous aurez du mal à voir quoi que ce soit. Si vous avez 4 variables explicatives (comme pour faire l'ACP ou le clustering), tracer 3 en coordonnées euclidiennes et la 4ème en utilisant une cartographie non linéaire pour colorer en introduisant un biais de perception, qui ne peut pas être quantifié.
Dianne Cook
@DianneCook c'est vrai. Je suppose que c'est ce que j'obtiens pour toujours travailler avec des données volumétriques 3D lisses et continues;)
mklingen
Hé, c'est ce que la question a demandé% ^)
Dianne Cook
9

Avez-vous quatre variables quantitatives? Si c'est le cas, essayez des visites guidées, des tracés de coordonnées parallèles, des matrices de nuages ​​de points. Le package tourr (et tourrGui) dans R exécutera des visites, essentiellement une rotation dans des dimensions élevées, vous pouvez choisir de projeter en 1D, 2D ou plus, et il y a un document JSS que vous pouvez lire pour commencer cité dans le package. Les tracés de coordonnées parallèles et les matrices de nuages ​​de points sont dans le package GGally, les matrices de nuages ​​de points sont également dans le package YaleToolkit. Vous pouvez également consulter le http://www.ggobi.org pour des vidéos et plus de documentation sur tous ces éléments.

Si vos données sont entièrement catégorielles, vous devez utiliser des graphiques en mosaïque ou des variantes. Jetez un oeil au package productplots dans R, également vcd a des fonctions raisonnables, ou au package ggparallel pour faire l'équivalent des tracés de coordonnées parallèles pour les données catégorielles. En outre, nous venons de découvrir que le package extracat a certaines fonctions pour afficher des données catégorielles.

J'ai mal lu la question, à l'origine, parce que je me suis arrêté sur la question et j'ai négligé de lire la description complète. Semblable à l'approche ci-dessous (coloration des points en 3D), vous pouvez utiliser le brossage lié pour explorer des fonctions définies dans des espaces de grande dimension. Jetez un oeil à la vidéo ici qui montre cela pour une fonction normale multivariée 3D. La brosse peint des points à haute densité (valeurs de fonction élevées), puis se déplace vers des valeurs de densité de plus en plus faibles (valeurs de fonction faibles). Les emplacements où la fonction est échantillonnée sont affichés dans un diagramme de dispersion rotatif 3D, à l'aide de la visite guidée, qui pourrait également être utilisé pour examiner des domaines dimensionnels 4, 5 ou supérieurs.

Dianne Cook
la source
2

Essayez les visages de Chernoff . L'idée est d'attacher les variables aux traits du visage. Par exemple, la taille du sourire serait une variable, la rondeur du visage en est une autre, etc.

Une autre façon consiste à montrer des projections 2D du diagramme de phases 3D. Disons que vous avez x1, x2, x3, x4 vos variables. Pour chaque valeur de x4, tracez un graphique 3D de points (x1, x2, x3) et connectez les points. Cela fonctionne mieux lorsque x4 est commandé, par exemple, c'est la date ou l'heure.

MISE À JOUR: Vous pouvez également essayer des graphiques à bulles. Trois dimensions seraient habituelles cartésiennes x, y, z, et la 4ème dimension serait la taille du point de bulle.

Vous pouvez essayer l'animation, c'est-à-dire utiliser le temps comme quatrième dimension.

Également une combinaison de bulle et d'animation: x, y, bulle et temps.

En outre, Chernoff est lié à l' intrigue de glyphes , qui peut sembler un peu plus grave. Ce sont des étoiles dont la longueur des rayons est proportionnelle aux valeurs variables.

Aksakal
la source
Merci pour la réponse. Il semble que la deuxième option soit possible pour mon problème. Je pense que le premier ne semble pas si grave pour un document de recherche. Fondamentalement, je voudrais que l'intrigue puisse révéler une tendance ou une influence de trois facteurs sur la valeur (quatrième dimension).
Tyler 傲 来 国 主
5
Les visages de Chernoff ont été utilisés dans des recherches sérieuses, afaik.
Aksakal
1
Les faces de Chernoff peuvent être extrêmement utiles, surtout lorsque la dimensionnalité est d'environ 10 à 20 variables. Pour quatre dimensions, elles ne sont pas aussi efficaces que d'autres types de représentations graphiques.
whuber
3
les visages chernoff sont une idée terrible! si vous devez utiliser un tracé d'icônes, utilisez un tracé en étoile. Si vous avez un très petit ensemble de données, cela pourrait être utile, mais essayez de tracer 1000 icônes et voyez si vous pouvez vraiment voir quoi que ce soit!
Dianne Cook du