Est-ce nominal, ordinal et binaire pour les données quantitatives, qualitatives ou les deux?

9

Je m'emballe autour des types de données et j'ai besoin d'aide:

entrez la description de l'image ici

Si vous regardez l'image ci-dessus (prise d' ici ), elle a les types de données comme ceci:

  • Quantitatif (discret, continu)
  • Qualitatif (nominal (N), ordinal (O), binaire (B)).

entrez la description de l'image ici

Mais si vous regardez cette photo suivante (d' ici ), les catégories sont:

  • Quantitatif (discret (NOB))
  • Qualitatif

Une image a NOB sous Qualitative, l'autre l'a sous Quantitative. Laquelle est correcte?

Penché
la source
5
Chaque puce dans la description des "données discrètes" est erronée et trompeuse.
whuber

Réponses:

5

Ces typologies peuvent facilement confondre autant qu'elles expliquent.

Par exemple, les données binaires, tel qu'introduit dans de nombreux textes ou cours d'introduction, certainement de qualité qualitative: oui ou non, survécu ou mort, présent ou absent, homme ou femme, peu importe. Mais marquez les deux possibilités 1 ou 0 et tout est alors parfaitement quantitatif. Une telle notation est à la base de toutes sortes d'analyses: la proportion de femmes n'est que la moyenne de plusieurs 0 pour les hommes et de 1 pour les femmes. Si je rencontre 7 femmes et 3 hommes, je peux simplement faire la moyenne de 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 pour obtenir la proportion 0,7. Avec les réponses binaires, vous avez alors une grande voie ouverte pour la régression logit et probit, et ainsi de suite, qui se concentre sur la variation de la proportion, de la fraction ou de la probabilité survécue, ou quelque chose de similaire, avec quoi que ce soit d'autre qui le contrôle ou l'influence. Personne ne doit s'inquiéter du fait que le codage est arbitraire. La proportion d'hommes est juste 1 moins la proportion de femmes,

Presque la même chose est vraie lorsque des données nominales ou ordinales sont prises en compte, car toute analyse de ces données dépend du premier comptage du nombre de chaque catégorie et ensuite vous pouvez être aussi quantitatif que vous le souhaitez. Les camemberts et les graphiques à barres, tels qu'ils ont été rencontrés pour la première fois au cours des premières années, le montrent, il est donc surprenant de savoir combien de comptes manquent à cela dans les explications.

Autrement dit, vous pouvez classer les données brutes ou originales comme déclarées pour la première fois et comme apparaissant dans, par exemple, la cellule d'un tableur ou d'une base de données. Mais sa forme originale n'est pas immuable. Imaginez quelque chose de frappant comme une mort de perplexité en lisant trop de manuels superficiels. Cela peut être écrit sur un certificat, mais l'analyse statistique ne s'arrête jamais là. Il y a une agrégation des dénombrements (combien de ces décès dans une région et une période de temps), une réduction des taux (combien par rapport à la population à risque), etc.

Ainsi, la façon dont les données sont d'abord encodées empêche rarement leur utilisation par d'autres moyens et leur transformation sous d'autres formes. L'étymologie des données est ici révélatrice: en traduisant littéralement le latin original, elles vous sont données , mais il n'y a pas de règle interdisant de les convertir sous de nombreuses autres formes.

Nick Cox
la source
5

Tout, je ne pouvais pas trouver une image qui rassemblait tout, alors j'en ai fait une basée sur ce que j'ai étudié. Mettre les échelles de mesure sur le même diagramme avec les types de données me déroutait, j'ai donc essayé de montrer qu'il y avait une distinction.

entrez la description de l'image ici

J'apprécie votre aide et vos pensées! Cordialement, Penchée

Penché
la source
Les variables quantitatives discrètes (comme les dénombrements) peuvent également être mesurées à l'aide d'une échelle d'intervalle ou de rapport! Voir ici , par exemple.
Rodvi
3

Cela dépend de ce que vous entendez par «données quantitatives» et «données qualitatives».

Je pense que les deux sites que vous citez utilisent les termes différemment. Supposons, par exemple, que vous demandiez aux gens:

Did you vote for Obama, Romney, someone else or no one in the presidential election?

De quel type de données s'agit-il? La variable est nominale: ce ne sont que des noms, il n'y a pas d'ordre. Mais beaucoup de gens le qualifieraient de quantitatif car l'essentiel est de savoir combien choisissent quel candidat. C'est par opposition aux données qualitatives qui pourraient être des transcriptions d'entretiens sur ce qu'ils aiment le plus à propos d'Obama (ou Romney ou qui que ce soit).

Une meilleure façon de voir les choses consiste à distinguer clairement les données quantitatives des variables quantitatives.

Peter Flom
la source
Dans le premier cas, il y a une variable, qui contient le nom du président. La variable est qualitative, pour être précis est nominale. Dans le second cas, chaque président-nom correspond à une variable individuelle, qui détient les électeurs. Si les noms des électeurs sont connus et qu'ils contiennent des noms d'électeurs, la variable est nominale. S'il détient un nombre de voix, la variable est quantitative, pour être précis, elle est en échelle de rapport.
Ioannis Iliadis - Ilousis
2

Aucun de ces graphiques n'est correct. Ils sont plutôt absurdes et vous avez raison d'être confus (à part la contradiction).

Ils semblent confondre les idées de type de variable fondamentale et de sélection de variable pour modéliser un système (avec un pdf).

Il existe 3 types de variables fondamentales (hors sous-types): Nominal (catégorique / qualitatif), Ordinal et Continu (Numérique, Quantitatif). Ordinal a un caractère à la fois qualitatif et quantitatif.

L'attribut n'est pas vraiment de type basique mais est généralement discuté de cette façon lors du choix d'une carte de contrôle appropriée, où l'on choisit le meilleur pdf avec lequel modéliser le système. Ceci est parfois appelé "données d'attribut", mais son type est nominal (alias catégorique, etc.). Comme Nick l'a mentionné, nous comptons les nominaux, il peut donc être confondu avec un type numérique, mais ce n'est pas le cas.

mandata
la source
1
Mandata, en fonction de ce que vous dites, quelles modifications apporteriez-vous au tableau que j'ai fait ci-dessus? J'apprécie ton aide. Cordialement, Penchée
Penchée le
Mandata, tous ces tableaux de différents experts sont en partie corrects. Le fait est que les gens ne comprennent pas les mots et les concepts de manière totalement identique, mais ils préfèrent, pour une longue ou courte période, s’adapter à leur propre compréhension confortable. Par exemple, certaines personnes rejetteront d'appeler l'échelle ordinale «quantitative» tandis que d'autres accepteront, selon que la «quantité» est nécessairement manifeste de la catégorie potentiellement sous-jacente de l'être.
ttnphns
@Penché. Ce graphique est meilleur que le précédent. Je considérerais discrète une qualité de type, pas un type lui-même. Le nominal et l'ordre sont entièrement discrets, tandis que le dénombrable (fini ou infini) l'est également. Le binaire est également une caractéristique de type (c'est un sous-ensemble de discret). Le binaire est rarement ordonné et est presque toujours représenté par des variables nominales. Les catégories et les valeurs nominales sont synonymes. les différences entre les variables ordonnées n'ont guère de sens, elles peuvent être partiellement ou entièrement inconnues, ou non pertinentes (cette dernière implique le vide de sens), mais je n'affirme pas cela.
mandata
@ttnphns, je suis d'accord avec ce que vous dites en esprit, mais ils ont tous deux de graves erreurs conceptuelles. le premier mélange l'idée de type de données d'attribut, qui est utilisée pour sélectionner une carte de contrôle, quel type de données de base. Le second a nominal comme un sous-ensemble de discret qui est un sous-ensemble de continu. Je pourrais sous-ensemble discret, mais le nominal appartient au qualitatif. Peut-être que c'est là parce qu'on compte discrètement les événements nominaux, mais même si c'est pourquoi c'est incorrect.
mandata
Je ne pense pas que la théorie de l'intervalle / rapport soit une manière valide de décrire le type de variable. Cela pourrait être bon pour déterminer quelles fonctions sont raisonnables quand on n'a pas confiance en les mathématiques, mais au-delà, je vois une échelle comme une transformation d'une autre échelle si elles représentent les mêmes dimensions ou unités.
mandata
1

J'ai trouvé cette question en recherchant les niveaux de mesure et les concepts associés. Je pense que les graphiques de la question manquent de contexte. Lorsque nous procédons à la catégorisation, nous définissons les règles de regroupement des objets en fonction de notre objectif. Quel est donc le but? Et parlons-nous des variables?

Nous pourrions classer les variables selon les niveaux de mesure , puis nous pourrions avoir 4 échelles (groupes) avec les règles suivantes:

nominal : les attributs d'une variable ne sont différenciés que par leur nom (catégorie) et il n'y a pas d'ordre (rang, position).
ordinal : les attributs d'une variable sont différenciés par ordre (rang, position), mais nous ne connaissons pas le degré relatif de différence entre eux.
intervalle : les attributs d'une variable sont différenciés par le degré de différence entre eux, mais il n'y a pas de zéro absolu, et le rapport entre les attributs est inconnu.
ratio : les attributs d'une variable sont différenciés par le degré de différence entre eux, il y a zéro absolu, et on pourrait trouver le ratio entre les attributs.

Et ce n'est qu'une approche de Stanley Smith Stevens. Il existe plusieurs autres typologies.

Les variables continues et discrètes sont des concepts mathématiques où nous avons une gamme de nombres réels et:

La variable continue peut prendre n'importe quelle valeur dans cette plage. Le nombre de valeurs autorisées est indénombrable.
tandis que pour une variable discrète, le nombre de valeurs autorisées dans la plage est soit fini, soit infiniment dénombrable.

wombatonfire
la source