Il semble que vous puissiez utiliser le codage pour une variable catégorielle, mais j'ai deux variables prédictives catégoriques et une variable prédictive continue. Puis-je utiliser la régression multiple pour cela dans SPSS et si oui, comment? Merci!
12
Réponses:
la source
Vous pouvez certainement, en suivant la même méthode que vous utiliseriez pour le premier prédicteur catégorique. Créez des variables factices comme vous le feriez pour la première variable de ce type. Mais il est souvent plus facile d'utiliser la commande Unianova de SPSS. Vous pouvez le rechercher dans n'importe quel guide de syntaxe imprimé ou PDF, ou vous pouvez y accéder via Analyser ... Modèle linéaire général ... Univarié.
Bien qu'elle soit un peu plus compliquée, la commande de régression présente cependant un certain nombre d'avantages par rapport à Unianova. Le principal est que vous pouvez choisir «manquant par paire» (vous n'avez pas à perdre un cas simplement parce qu'il manque une valeur pour un ou deux prédicteurs). Vous pouvez également obtenir de nombreux diagnostics précieux tels que des graphiques partiels et des statistiques d'influence.
la source
Un moyen simple de transformer des variables catégorielles en un ensemble de variables factices à utiliser dans les modèles dans SPSS consiste à utiliser la syntaxe do repeat. C'est le plus simple à utiliser si vos variables catégorielles sont dans l'ordre numérique.
Sinon, vous pouvez simplement exécuter un ensemble d'instructions if pour créer vos variables factices. Ma version actuelle (16) n'a pas la capacité native de spécifier automatiquement un ensemble de variables factices dans la commande de régression (comme vous pouvez le faire dans Stata en utilisant la commande xi ) mais je ne serais pas surpris si cela était disponible dans une version plus récente. Prenez également note du point n ° 2 de dmk38, ce schéma de codage suppose des catégories nominales. Si votre variable est ordinale, une plus grande discrétion peut être utilisée.
Je suis également d'accord avec dmk38 et le fait que la régression soit meilleure en raison de sa capacité à spécifier les données manquantes d'une manière particulière est un problème complètement distinct.
la source