Quelqu'un connaît-il une méthode pour comparer deux variables avec un test du chi carré si les variables proviennent d'enquêtes différentes avec des svydesign()
énoncés différents ? Je cherche à tester une différence dans une distribution variable sur deux vagues d'une enquête, mais l' svychisq()
énoncé est limité à un objet de conception.
Est-il légitime d'empiler les deux variables dans une nouvelle data.frame
, de créer une nouvelle svydesign
instruction avec les poids collectifs, puis d'exécuter le test?
r
chi-squared
survey
David Rae
la source
la source
Réponses:
Si vous suivez le chemin de l'empilement des ensembles de données, vous devez définir des super-strates correspondant aux deux ensembles de données / vagues, de manière à ce qu'elles
svydesign()
sachent qu'elles sont indépendantes. Ainsi, votre nouveausvydesign
aura strates = croisement de l'année et des strates, les blocs d'alimentation des modèles originaux et les poids des modèles originaux.Comme je l'ai suggéré dans le commentaire, d'autres façons de combiner les estimations et les tests ont été proposées dans la littérature. Wu (2004) utilise la vraisemblance empirique basée sur des variables communes entre les deux ensembles de données.
Pour les variables continues, idéalement, vous voudriez utiliser le test de Kolmogorov-Smirnov avec des données "plates", mais je ne sais pas si les extensions pour cela fonctionnent pour les données d'enquête; J'en doute. Vous devrez donc peut-être convertir vos variables continues en variables ordinales en[Journal2( n ) ] groupes de centiles ou bacs de largeur égale de la plage variable (où la fonction ci-dessus de la taille de l'échantillon est un nombre de bacs couramment utilisé pour un histogramme), et appliquer le Rao-Scott χ2 pour eux.
la source