Je songe à construire un modèle prédisant un rapport , où et et . Le rapport serait donc compris entre et .
Je pourrais utiliser la régression linéaire, bien qu'elle ne soit pas naturellement limitée à 0..1. Je n'ai aucune raison de croire que la relation est linéaire, mais bien sûr, elle est souvent utilisée comme premier modèle.
Je pourrais utiliser une régression logistique, bien qu'elle soit normalement utilisée pour prédire la probabilité d'un résultat à deux états, et non pour prédire une valeur continue de l'intervalle 0..1.
Ne connaissant rien de plus, utiliseriez-vous la régression linéaire, la régression logistique ou l'option cachée c ?
Réponses:
Vous devriez choisir "option cachée c", où c est la régression bêta. Il s'agit d'un type de modèle de régression approprié lorsque la variable de réponse est distribuée sous forme bêta . Vous pouvez penser que cela ressemble à un modèle linéaire généralisé . C'est exactement ce que vous recherchez. Il y a un paquet dans
R
appelé betareg qui traite de ce sujet . Je ne sais pas si vous l'utilisezR
, mais même si vous ne pouviez pas lire les 'vignettes' de toute façon, elles vous donneraient des informations générales sur le sujet en plus de la manière de le mettre en œuvreR
(dont vous n'auriez pas besoin dans ce cas).Edit (beaucoup plus tard): Permettez-moi de faire une clarification rapide. J'interprète la question comme se rapportant au rapport de deux valeurs positives et positives. Si c'est le cas (et ils sont distribués en tant que Gammas), il s'agit d'une distribution bêta. Toutefois, si est un décompte de "succès" sur un total connu, , de "essais", il s'agira alors d'une proportion de comptage , et non d'une proportion continue, et vous devrez utiliser la méthode binomiale GLM (par exemple, logistique). régression). Pour savoir comment le faire dans R, voir par exemple Comment faire une régression logistique dans R lorsque le résultat est fractionnaire (un ratio de deux comptes)?une b une / b
Une autre possibilité consiste à utiliser une régression linéaire si les rapports peuvent être transformés de manière à respecter les hypothèses d'un modèle linéaire standard, bien que je ne sois pas optimiste quant à l'efficacité de ce dernier.
la source
S'agit-il d'échantillons appariés ou de deux populations indépendantes?
Votre interception de cette régression sera log (B) et votre pente sera log (ratio).
Voir plus ici:
Beyene J, Moineddin R. Méthodes d'estimation de l'intervalle de confiance d'un paramètre de rapport avec application aux quotients de localisation. Méthodologie de recherche médicale BMC. 2005; 5 (1): 32.
EDIT: J'ai écrit un addon SPSS pour faire cela. Je peux le partager si cela vous intéresse.
la source
REGRESSION
après la transformation du journal des données. Depuis lors, j'ai écrit une version plus sophistiquée qui utiliseGLM
. Je traite des mesures d’émission de lumière et mes tests suggèrent que la régression gamma avec une liaison log-link était la moins sujette à une incertitude extrême sur les paramètres. Pour la plupart de mes données réelles, les réponses issues de l'utilisation de normal, binomiale négative et gamma avec log-link étaient toutes très similaires (au moins à la précision dont j'avais besoin)la source