Qu'est-ce qui est contingent dans un tableau de contingence?

13

Le dictionnaire Merriam-Webster définit un événement ou une situation contingente comme

1 : likely but not certain to happen : possible
2 : not logically necessary; especially : empirical
3 a : happening by chance or unforeseen causes
  b : subject to chance or unseen effects : unpredictable
  c : intended for use in circumstances not completely foreseen
4 : dependent on or conditioned by something else
5 : not necessitated : determined by free choice

En ce qui concerne la terminologie statistique actuelle, puisque les tableaux de contingence sont utilisés pour représenter une grande variété de données dans de nombreuses situations différentes, pourquoi les appelons-nous des tableaux de "contingence"? Dans lequel des cinq sens ci-dessus le mot «contingence» est-il utilisé dans cette terminologie?

Zen
la source

Réponses:

16

Wikipedia affirme que le terme a été introduit par Pearson dans On the theory of contingency and its relation to association and normal correlation . Pearson semble en effet avoir inventé le terme. Il dit (se référant aux tableaux bidirectionnels):

J'appelle toute mesure de l'écart total de la classification de la probabilité indépendante une mesure de sa contingence . Clairement, plus la contingence est grande, plus la quantité d'association ou de corrélation entre les deux attributs doit être grande, car cette association ou corrélation est uniquement une mesure d'un autre point de vue du degré d'écart par rapport à l'indépendance de l'occurrence.

(Pearson, Sur la théorie de la contingence et sa relation avec l'association et la corrélation normale , 1904, p. 5-6.)

Pearson explique dans l'introduction que lui et d'autres avaient précédemment considéré les variables catégorielles comme ordonnées en toutes circonstances et les avaient analysées comme telles. Par exemple, afin d'analyser la couleur des yeux,

une couleur des yeux disposée dans ce qui semblait correspondre à des quantités variables de pigment orange [...]

Le but de l'article est de développer des méthodes pour analyser les variables catégorielles sans mettre un ordre artificiel sur les catégories.

La première utilisation du terme tableau de contingence apparaît à la page 34 du même document:

Ce résultat nous permet de partir de la théorie mathématique des probabilités indépendantes développée dans les manuels élémentaires, et d'en construire une théorie généralisée de l'association, ou, comme je l'appelle, de la contingence. Nous arrivons à la notion d'un pur tableau de contingence, dans lequel l'ordre des sous-groupes n'a aucune importance.

Ainsi, la contingence est censée signifier la "non-indépendance". Le mot contingence est utilisé parce que deux événements sont contingents si le résultat de l'un est subordonné - c'est-à-dire dépendant - c'est-à-dire non indépendant de - le résultat de l'autre.

En d'autres termes, c'est lié à la définition 4 de cette page Merriam-Webster .

Flet
la source
2
L'article de Peason est disponible ici: archive.org/details/cu31924003064833
Zen
2
Il s'agit d'un curieux cas de «terminologie oubliée». Je ne connais pas un seul manuel expliquant la signification du nom.
Zen