J'ai pensé à ce problème. La fonction logistique habituelle pour la modélisation des données binaires est: Cependant, la fonction logit, qui est une courbe en forme de S , toujours le meilleur pour modéliser les données? Vous avez peut-être des raisons de croire que vos données ne suivent pas la courbe en S normale mais un type de courbe différent avec le domaine .
Y a-t-il des recherches à ce sujet? Vous pouvez peut-être le modéliser comme une fonction probit ou quelque chose de similaire, mais que se passe-t-il si c'est autre chose entièrement? Cela pourrait-il conduire à une meilleure estimation des effets? Juste une pensée que j'ai eue, et je me demande s'il y a des recherches à ce sujet.
Réponses:
Les gens utilisent toutes sortes de fonctions pour garder leurs données entre 0 et 1. Les cotes logarithmiques tombent naturellement du calcul lorsque vous dérivez le modèle (on l'appelle la "fonction de lien canonique"), mais vous êtes absolument libre d'expérimenter avec d'autres alternatives.
Comme Macro l'a mentionné dans son commentaire sur votre question, un choix commun est un modèle probit , qui utilise la fonction quantile d'un gaussien au lieu de la fonction logistique. J'ai également entendu de bonnes choses à propos de l'utilisation de la fonction quantile de la distribution d'un étudiant , même si je ne l'ai jamais essayée.t
J'espère que cela t'aides.
Modifié pour ajouter : La discussion liée à @Macro est vraiment excellente. Je vous recommande fortement de le lire si vous êtes intéressé par plus de détails.
la source
Je ne vois aucune raison, a priori, pour laquelle la fonction de lien appropriée pour un ensemble de données donné doit être le logit (bien que l'univers semble être plutôt gentil avec nous en général). Je ne sais pas si ce sont tout à fait ce que vous recherchez, mais voici quelques articles qui discutent des fonctions de lien plus exotiques:
Cauchit (etc.):
Koenker, R. et Yoon, J. (2009). Liens paramétriques pour les modèles de choix binaires: un colloque pêcheur-bayésien . Journal of Econometrics, 152, 2 , p. 120-130.
Koenker, R. (2006). Liens paramétriques pour les modèles de choix binaires . Rnews, 6, 4 , pp. 32-34.
Scobit :
Nagler, J. (1994). Scobit: Un estimateur alternatif pour logit et probit . American Journal of Political Science, 38, 1 , pp. 230-255.
Skew-Probit :
Bazan, JL, Bolfarine, H., et Branco, MD (2010). Un cadre pour les liens skew-probit dans la régression binaire . Communications in Statistics - Theory and Methods, 39 , p. 678-697.
(Cela semble être un bon aperçu des liens asymétriques dans un cadre bayésien) :
Chen, MH (2004). Modèles de liens asymétriques pour les données de réponse catégorielles . Dans Skew-Elliptical Distributions and their Applications: A Journey Beyond Normality , Marc Genton, éditeur. Chapman et Hall.
Divulgation: je ne connais pas bien ce matériel. J'ai essayé de jouer avec le Cauchit et le Scobit il y a quelques années, mais mon code a continué de planter (probablement parce que je ne suis pas un grand programmeur), et il ne semblait pas pertinent pour le projet sur lequel je travaillais, alors je l'ai laissé tomber .
la source
La meilleure stratégie consiste à modéliser les données à la lumière de ce qui se passe (pas de surprise!)
Il n'y a probablement pas de recherche sur ces modèles en tant que tels, bien qu'il y ait eu beaucoup de recherches sur l'un de ces modèles, et sur les comparaisons entre eux, et sur différentes façons de les estimer. Ce que vous trouvez dans la littérature, c'est qu'il y a beaucoup d'activité pendant un certain temps, car les chercheurs envisagent un certain nombre d'options pour une classe particulière de problèmes, puis une méthode apparaît comme supérieure.
la source
la source