J'essaie de prédire une variable de réponse en régression linéaire qui devrait toujours être positive (coût par clic). C'est un montant monétaire. Dans AdWords, vous payez Google pour les clics sur vos annonces, et un nombre négatif signifie que Google vous paie lorsque les utilisateurs cliquent sur: P
Les prédicteurs sont tous des valeurs continues. Le Rsquared et le RMSE sont décents par rapport aux autres modèles, même hors échantillon:
RMSE Rsquared
1.4141477 0.8207303
Je ne peux pas redimensionner les prévisions, car c'est de l'argent, donc même un petit facteur de redimensionnement pourrait changer les coûts de manière significative.
Pour autant que je comprends, pour le modèle de régression, il n'y a rien de spécial à propos des nombres nuls et négatifs, donc il trouve le meilleur hyperplan de régression, que la sortie soit en partie négative.
Ceci est une toute première tentative, en utilisant toutes les variables dont je dispose. Il y a donc place à raffinement.
Existe-t-il un moyen de dire au modèle que la sortie ne peut pas être négative?
la source
Réponses:
Je suppose que vous utilisez l'estimateur OLS sur ce modèle de régression linéaire. Vous pouvez utiliser l' estimateur des moindres carrés contraint par l' inégalité , qui sera la solution à un problème de minimisation sous des contraintes d'inégalité. En utilisant la notation matricielle standard (les vecteurs sont des vecteurs de colonne), le problème de minimisation est indiqué comme suit:
... où est , est , est et est la matrice contenant la série de régresseurs hors échantillon de longueur utilisée pour la prédiction. Nous avons contraintes d'inégalité linéaire (et la fonction objectif est convexe, donc les conditions du premier ordre sont suffisantes pour un minimum).y n×1 X n×k β k×1 Z m×k m m
Le lagrangien de ce problème est
où est un vecteur de colonne de multiplicateurs Karush -Kuhn -Tucker non négatifs. Les conditions du premier ordre sont (vous voudrez peut-être revoir les règles de différenciation matricielle et vectorielle)λ m×1
... où , pour plus de commodité, et est l'estimateur que nous obtiendrions à partir de l'estimation des moindres carrés ordinaires.ξ=12λ β^OLS
La méthode est entièrement élaborée dans Liew (1976) .
la source