Des questions:
- Des modèles linéaires inappropriés sont-ils utilisés dans la pratique ou s'agit-il d'une sorte de curiosité décrite de temps en temps dans des revues scientifiques? Si oui, dans quels domaines sont-ils utilisés?
- Existe-t-il d'autres exemples de tels modèles?
- Enfin, les erreurs standard, les valeurs de , etc. extraites de l'OLS pour de tels modèles seraient-elles correctes, ou devraient-elles être corrigées d'une manière ou d'une autre?
Contexte: Des modèles linéaires incorrects sont décrits de temps à autre dans la littérature. En général, ces modèles peuvent être décrits comme
ce qui les différencie de la régression, c'est que les ne sont pas des coefficients estimés dans le modèle, mais sont des poids qui sont
- égal pour chaque variable ( régression pondérée par unité ),
- basé sur des corrélations (Dana et Dawes, 2004),
- choisis au hasard (Dawes, 1979),
- pour les variables liées négativement à , pour les variables liées positivement à (Wainer, 1976).
Il est également courant d'utiliser une sorte de mise à l'échelle des fonctionnalités, comme la conversion de variables en scoresDonc, ce type de modèle peut être simplifié pour une régression linéaire univariée
où , et peut être simplement estimé en utilisant la régression OLS.
Références:
Dawes, Robyn M. (1979). La beauté robuste des modèles linéaires inappropriés dans la prise de décision . Psychologue américain, 34, 571-582.
Graefe, A. (2015). Amélioration des prévisions à l'aide de prédicteurs également pondérés . Journal of Business Research, 68 (8), 1792-1799.
Wainer, Howard (1976). Estimation des coefficients dans les modèles linéaires: cela ne fait pas de bruit . Bulletin psychologique 83 (2), 213.
Dana, J. et Dawes, RM (2004). La supériorité des alternatives simples à la régression pour les prédictions en sciences sociales . Journal of Educational and Behavioral Statistics, 29 (3), 317-331.
Réponses:
En fait, il me semble qu'il s'agit d'un assortiment de structures de covariance supposées. En d'autres termes, il s'agit d'un type de modélisation antérieure bayésienne.
Mon expérience personnelle est que le supérieur à l'approche bayésienne est d'utiliser une meilleure modélisation; transformer les paramètres, utiliser d'autres normes et / ou utiliser des méthodes non linéaires. Autrement dit, une fois que la physique du problème et les méthodes sont correctement explorées et coordonnées, les statistiques F, le coefficient de détermination, etc. s'améliorent plutôt qu'ils ne se dégradent.
la source