Qu'est-ce que l'analyse des données en français?

9

Certaines méthodes statistiques - je ne me souviens pas s'il s'agit de l'analyse en composantes principales ou quelque chose du genre - sont parfois appelées "analyse des données françaises". C'est quoi exactement ? Et certaines personnes disent que ce nom est ironique, est-ce vrai, et pourquoi?

Stéphane Laurent
la source
1
Bonne question! Je n'ai remarqué qu'hier qu'Analyze des données est un «bon article» sur Wikipédia français, et que son contenu est très différent de l' article d'analyse de données dans Wikipédia anglais .
onestop
4
Peut-être que cet article est intéressant: Analyse de données multivariées: à la française
Tim
2
Ce document semble répondre à la question - et c'est le premier succès sur Google. Peut-être que ce n'était pas une si bonne question après tout ...
onestop
2
il doit y avoir des langues impliquées
Aksakal

Réponses:

16

L'analyse des données à la française est généralement identifiée comme un travail basé sur l'analyse des correspondances et d'autres travaux à orientation spectrale, mais est en fait plus profondément ancrée. La référence de Tim à la pièce Holmes est particulièrement utile ici.

Une image un peu large serait de dire que le style français adopte une approche axiomatique, géométrique et mathématique des matrices de données plutôt qu'une modélisation statistique. Le terme doit être un peu ironique car bien que CA ait été popularisé par Benzecri, LeBart etc. (français), il a des précurseurs à Hirschfeld (allemand) et des successeurs à de Leeuw / Gifi (néerlandais) et des vulgarisateurs à Greenacre (sud-africain). Greenacre a également noté un lien important avec la SVD généralisée et a généré pour moi le seul livre facilement lisible sur le sujet. Les discussions peuvent devenir caustiques - voir la revue de Leeuw de Murtagh .

Un exemple utile pour voir les conséquences comparatives du style est dans l'analyse des tableaux croisés. Avec un tableau croisé simple, on pourrait comparer le style «français» de l'analyse de correspondance simple basée sur la décomposition spectrale d'une table convenablement transformée, avec la modélisation d'association (par exemple par Goodman, Clogg ou Haberman) basée sur des termes d'interaction structurée dans un modèle linéaire logarithmique sous-jacent . En fait, ces deux approches génèrent des paramétrisations (et des paramètres!) Très similaires, mais l'objectif est assez différent. Agresti (1990) a une excellente discussion.

conjugateprior
la source
1
Que vous avez mentionné l' équipe Gifi (alias Leiden univ. Nom de plume ) et le travail de Greenacre est vraiment bon! Je suis en train de relire le livre où les auteurs fournissent une discussion approfondie de votre dernier paragraphe. Mon gros +1.
chl
3

Peut-être "analyse de correspondance"? : http://en.wikipedia.org/wiki/Correspondence_analysis car il a été principalement développé par un chercheur français Jean-Paul Benzecri?

Florian
la source
1
On m'a dit que cette "analyse multivariée des données françaises" était ironiquement qualifiée d '"analyse des données françaises" car au moment où ces méthodes ont été créées, elles étaient impraticables (trop gourmandes en calcul).
Stéphane Laurent
2
Florian> Développé par Benzecri et très utilisé par Bourdieu.
2
@ StéphaneLaurent: même si l'axiomatisation a franchi la clôture de manière typiquement française, Analyse des Données a été pratique et utilisée. Si vous pouvez vous procurer un "Cahiers de l'Analyse des Données" , vous pouvez le vérifier!
Xi'an