J'ai souvent vu des ensembles de données discrets tracés comme des tracés linéaires, mais il me semble que la ligne infère une valeur à un point entre les intervalles de mesure, ce qui n'a pas de sens pour les ensembles de données discrets. Est-ce donc le cas que l'utilisation des tracés linéaires pour des données discrètes est erronée?
Par exemple, prenez deux ensembles de données chronologiques, un continu (mon poids, mesuré quotidiennement le matin) et un discret (le nombre de beignets que je mange par jour). Il est logique que le premier ensemble de données soit un tracé linéaire, car il est raisonnable de déduire que mon poids dans un après-midi donné sera lié à mon poids les matins précédent et suivant. Cependant, si le nombre de beignets est représenté sous forme de graphique linéaire, les lignes entre les points sans signification peuvent être déduites de cette ligne.
ÉDITER
Voici un autre exemple: le salaire horaire minimum fédéral depuis sa création à http://mste.illinois.edu/courses/ci330ms/youtsey/lineinfo.html
Sauf erreur, les changements de salaire minimum sont discrets, et il n'est donc pas possible de rechercher une heure arbitrairement sélectionnée et d'établir le salaire minimum au point à l'aide de la ligne reliant les points.
la source
Réponses:
Les tracés de ligne connectés se sont révélés trop utiles pour se limiter à une seule interprétation. Quelques utilisations importantes:
la source
Eh bien, les beignets pourraient être liés au poids :-)
Pendant que je vois votre point, je pense que cet exemple n'est pas si mal parce que le temps (sur l'axe horizontal, auquel les lignes se réfèrent) est continu. Le sens de la ligne, pour moi, n'est pas tant que, à chaque moment de la journée, vous avez mangé un certain nombre de beignets, mais que le nombre de beignets par jour change de manière régulière. Ainsi, nous pourrions ajouter quelque chose comme un loess plus lisse à la ligne, et cela aurait du sens. Il est au moins raisonnable de penser à des beignets mangés à chaque heure, voire à chaque minute (même si cela serait plus judicieux avec une variable où le nombre par jour était plus élevé)
Ce qui est plus inquiétant, c'est lorsque l' axe horizontal est discret (et surtout lorsqu'il est nominal) mais que des lignes sont tracées. Cela n'a vraiment aucun sens. Par exemple, si vous regardez (disons) le% de votes pour Obama parmi (disons) les résidents de différentes régions des États-Unis, cela n'a aucun sens de tracer une ligne entre le Nord-Est et le Midwest; d'autant plus que l'ordre des régions est arbitraire, mais changer l'ordre changerait les lignes. Pourtant, j'ai vu des graphiques comme celui-ci.
la source