Je m'emballe autour des types de données et j'ai besoin d'aide:
Si vous regardez l'image ci-dessus (prise d' ici ), elle a les types de données comme ceci:
- Quantitatif (discret, continu)
- Qualitatif (nominal (N), ordinal (O), binaire (B)).
Mais si vous regardez cette photo suivante (d' ici ), les catégories sont:
- Quantitatif (discret (NOB))
- Qualitatif
Une image a NOB sous Qualitative, l'autre l'a sous Quantitative. Laquelle est correcte?
Réponses:
Ces typologies peuvent facilement confondre autant qu'elles expliquent.
Par exemple, les données binaires, tel qu'introduit dans de nombreux textes ou cours d'introduction, certainement de qualité qualitative: oui ou non, survécu ou mort, présent ou absent, homme ou femme, peu importe. Mais marquez les deux possibilités 1 ou 0 et tout est alors parfaitement quantitatif. Une telle notation est à la base de toutes sortes d'analyses: la proportion de femmes n'est que la moyenne de plusieurs 0 pour les hommes et de 1 pour les femmes. Si je rencontre 7 femmes et 3 hommes, je peux simplement faire la moyenne de 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 pour obtenir la proportion 0,7. Avec les réponses binaires, vous avez alors une grande voie ouverte pour la régression logit et probit, et ainsi de suite, qui se concentre sur la variation de la proportion, de la fraction ou de la probabilité survécue, ou quelque chose de similaire, avec quoi que ce soit d'autre qui le contrôle ou l'influence. Personne ne doit s'inquiéter du fait que le codage est arbitraire. La proportion d'hommes est juste 1 moins la proportion de femmes,
Presque la même chose est vraie lorsque des données nominales ou ordinales sont prises en compte, car toute analyse de ces données dépend du premier comptage du nombre de chaque catégorie et ensuite vous pouvez être aussi quantitatif que vous le souhaitez. Les camemberts et les graphiques à barres, tels qu'ils ont été rencontrés pour la première fois au cours des premières années, le montrent, il est donc surprenant de savoir combien de comptes manquent à cela dans les explications.
Autrement dit, vous pouvez classer les données brutes ou originales comme déclarées pour la première fois et comme apparaissant dans, par exemple, la cellule d'un tableur ou d'une base de données. Mais sa forme originale n'est pas immuable. Imaginez quelque chose de frappant comme une mort de perplexité en lisant trop de manuels superficiels. Cela peut être écrit sur un certificat, mais l'analyse statistique ne s'arrête jamais là. Il y a une agrégation des dénombrements (combien de ces décès dans une région et une période de temps), une réduction des taux (combien par rapport à la population à risque), etc.
Ainsi, la façon dont les données sont d'abord encodées empêche rarement leur utilisation par d'autres moyens et leur transformation sous d'autres formes. L'étymologie des données est ici révélatrice: en traduisant littéralement le latin original, elles vous sont données , mais il n'y a pas de règle interdisant de les convertir sous de nombreuses autres formes.
la source
Tout, je ne pouvais pas trouver une image qui rassemblait tout, alors j'en ai fait une basée sur ce que j'ai étudié. Mettre les échelles de mesure sur le même diagramme avec les types de données me déroutait, j'ai donc essayé de montrer qu'il y avait une distinction.
J'apprécie votre aide et vos pensées! Cordialement, Penchée
la source
Cela dépend de ce que vous entendez par «données quantitatives» et «données qualitatives».
Je pense que les deux sites que vous citez utilisent les termes différemment. Supposons, par exemple, que vous demandiez aux gens:
De quel type de données s'agit-il? La variable est nominale: ce ne sont que des noms, il n'y a pas d'ordre. Mais beaucoup de gens le qualifieraient de quantitatif car l'essentiel est de savoir combien choisissent quel candidat. C'est par opposition aux données qualitatives qui pourraient être des transcriptions d'entretiens sur ce qu'ils aiment le plus à propos d'Obama (ou Romney ou qui que ce soit).
Une meilleure façon de voir les choses consiste à distinguer clairement les données quantitatives des variables quantitatives.
la source
Aucun de ces graphiques n'est correct. Ils sont plutôt absurdes et vous avez raison d'être confus (à part la contradiction).
Ils semblent confondre les idées de type de variable fondamentale et de sélection de variable pour modéliser un système (avec un pdf).
Il existe 3 types de variables fondamentales (hors sous-types): Nominal (catégorique / qualitatif), Ordinal et Continu (Numérique, Quantitatif). Ordinal a un caractère à la fois qualitatif et quantitatif.
L'attribut n'est pas vraiment de type basique mais est généralement discuté de cette façon lors du choix d'une carte de contrôle appropriée, où l'on choisit le meilleur pdf avec lequel modéliser le système. Ceci est parfois appelé "données d'attribut", mais son type est nominal (alias catégorique, etc.). Comme Nick l'a mentionné, nous comptons les nominaux, il peut donc être confondu avec un type numérique, mais ce n'est pas le cas.
la source
J'ai trouvé cette question en recherchant les niveaux de mesure et les concepts associés. Je pense que les graphiques de la question manquent de contexte. Lorsque nous procédons à la catégorisation, nous définissons les règles de regroupement des objets en fonction de notre objectif. Quel est donc le but? Et parlons-nous des variables?
Nous pourrions classer les variables selon les niveaux de mesure , puis nous pourrions avoir 4 échelles (groupes) avec les règles suivantes:
nominal : les attributs d'une variable ne sont différenciés que par leur nom (catégorie) et il n'y a pas d'ordre (rang, position).
ordinal : les attributs d'une variable sont différenciés par ordre (rang, position), mais nous ne connaissons pas le degré relatif de différence entre eux.
intervalle : les attributs d'une variable sont différenciés par le degré de différence entre eux, mais il n'y a pas de zéro absolu, et le rapport entre les attributs est inconnu.
ratio : les attributs d'une variable sont différenciés par le degré de différence entre eux, il y a zéro absolu, et on pourrait trouver le ratio entre les attributs.
Et ce n'est qu'une approche de Stanley Smith Stevens. Il existe plusieurs autres typologies.
Les variables continues et discrètes sont des concepts mathématiques où nous avons une gamme de nombres réels et:
La variable continue peut prendre n'importe quelle valeur dans cette plage. Le nombre de valeurs autorisées est indénombrable.
tandis que pour une variable discrète, le nombre de valeurs autorisées dans la plage est soit fini, soit infiniment dénombrable.
la source