OLS vs régression logistique pour une analyse exploratoire avec un résultat binaire

8

Dans le modèle logistique idéalisé, nous obtenons une courbe en S reliant chaque IV continu au DV. Mais en pratique, cette forme en S se produit rarement, ce qui rend l'approche logistique un peu moins supérieure pour de tels types de données. Bien entendu, les probabilités prédites selon lesquelles chaque observation sera "1" sur le DV sont utilisables en logistique et non en régression OLS, car dans ce dernier, ces probabilités peuvent dépasser les limites de [0,1]. Mais, à des fins exploratoires, et si nous n'avons pas besoin de probabilités prédites, à quel point est-il judicieux d'utiliser OLS pour voir quelles IV ont des relations fortes vs modérées vs faibles avec le DV? Cela ne reviendrait-il pas à une sorte de version multivariée de la corrélation point-bisériale? (Coefficients de régression standardisés, sans parler des statistiques de colinéarité et des graphiques partiels,

rolando2
la source

Réponses:

7

Si les variables explicatives ont des valeurs sur toute la ligne réelle, cela n'a pas de sens d'exprimer une attente qui est une proportion en en fonction linéaire de la variable définie sur toute la ligne réelle. Si la forme sigmoïde de la transformation logit ne décrit pas la forme, il est peut-être préférable de rechercher une transformation différente qui mappe en .[0,1][0,1](-,)

Michael R. Chernick
la source
4
+1. Pour ajouter à la dernière chose que Michael a dit, probit et log-log complémentaire sont deux autres fonctions qui mappent(0,1) à (-,)qui sont implémentés dans de nombreux progiciels.
Macro
3
Notez également que pratiquement n'importe quelle fonction qui correspond à un CDF pour une variable aléatoire de valeur réelle est candidate. Logistic, Probit et C-log-log sont trois de ces fonctions (variables aléatoires sécantes hyperboliques, valeurs normales et extrêmes). Ainsi, vous pouvez également utiliser "en principe" une fonction de lien skew-normal, ou une double exponentielle, ou t, etc. etc. La distribution T est utile lorsque les degrés de liberté sont traités comme inconnus, car vous pouvez approximativement équilibrer entre probit un lien logit une fonction.
probabilités
@probabilityislogic, vous avez soulevé un point important, mais nitpick: Je pense que la fonction logistique est le CDF (inverse) de la distribution logistique, pas la distribution sécante hyperbolique.
Macro
Merci à vous tous. Doit-il ressortir de vos réponses que vous n'utiliseriez pratiquement jamais de corrélation point-bisériale?
rolando2
Arrivé sur ce qui suit: "Régression OLS. Lorsqu'il est utilisé avec une variable de réponse binaire, ce modèle est connu comme un modèle de probabilité linéaire et peut être utilisé comme un moyen de décrire les probabilités conditionnelles. [...] Pour une discussion plus approfondie de [ ...] problèmes avec le modèle de probabilité linéaire, voir Long (1997, p. 38-40). Long, J. Scott (1997). Modèles de régression pour les variables dépendantes catégoriques et limitées. Thousand Oaks, CA: Sage Publications. " ats.ucla.edu/stat/stata/dae/logit.htm
rolando2