Quand R carré est-il négatif?

78

D'après ce que je comprends, ne peut pas être négatif car c'est le carré de R. Cependant, j'ai exécuté une régression linéaire simple dans SPSS avec une seule variable indépendante et une variable dépendante. Ma sortie SPSS me donne une valeur négative pour . Si je devais calculer cela manuellement à partir de R, alors serait positif. Qu'a fait SPSS pour calculer cela comme négatif?R 2 R 2R2R2R2

R=-.395
R squared =-.156
B (un-standardized)=-1261.611

Code que j'ai utilisé:

DATASET ACTIVATE DataSet1. 
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA 
           /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN 
           /DEPENDENT valueP /METHOD=ENTER ageP

Je reçois une valeur négative. Quelqu'un peut-il expliquer ce que cela signifie?

RSquared négatif

entrez la description de l'image ici

Anne
la source
3
Est-ce que cela répond à votre question? stats.stackexchange.com/questions/6181/… Si non, merci de fournir des informations supplémentaires: il s'agit de la "sortie SPSS" de quelle procédure?
whuber
2
Votre modèle de régression linéaire a-t-il une interception?
NPE
2
@Anne Encore une fois, quelle procédure SPSS utilisez-vous?
whuber
1
@ Anne Je vous suggère de ne pas tenir compte de la réponse de la série chronologique, car vos données ne sont pas des séries chronologiques et vous n'utilisez pas de procédure de série chronologique. Êtes-vous vraiment sûr que le carré R est donné comme une valeur négative? Sa magnitude est correcte: . J'ai examiné l'aide de SPSS pour voir si, par convention, la valeur de R au carré des R négatifs est annulée, mais je ne vois aucune preuve que ce soit le cas. Peut-être que vous pourriez poster une capture d'écran de la sortie où vous lisez le R au carré? (-0,395)2=0,156
whuber
1
La variable dépendante étant le prix des maisons, il est donc possible que l’IC à 95% soit de 120 000. Malheureusement, je ne peux pas poster les données ici car cela serait contraire aux conditions d'utilisation des données.
Anne

Réponses:

107

compare l'ajustement du modèle choisi à celle d'une ligne droite horizontale (l'hypothèse nulle). Si le modèle choisi va pire qu'une ligne horizontale, alors R 2 est négatif. Notez que R 2 n'est pas toujours la place de quoice soit, il peut avoir une valeur négative sans violer aucune règle de calcul. R 2 est uniquement négatif lorsque le modèle choisi ne suit pas la tendance des données, donc s'intègre pire qu'une ligne horizontale.R2R2R2R2

Exemple: ajuster les données à un modèle de régression linéaire contraint de telle sorte que l' interception soit égale à 1500 .Y1500

entrez la description de l'image ici

Le modèle n'a aucun sens compte tenu de ces données. C'est clairement le mauvais modèle, peut-être choisi par accident.

(SSreg)(SStot)R21-SSregSStotSSregSStotR2

R2rR2R2

R2

Harvey Motulsky
la source
3
@JMS C'est l'inverse de ce que mon pseudonyme indique: "/ ORIGIN" fixe l'interception à 0; "/ NOORIGIN" "indique à SPSS de ne pas supprimer la constante" ( Guide d'introduction à SPSS pour Windows )
whuber
10
@whuber Correct. @ harvey-motulsky Une valeur R ^ 2 négative est une impossibilité mathématique (et suggère un bogue informatique) pour une régression régulière de MCO (avec une interception). C’est ce que fait la commande "RÉGRESSION" et ce que l’affiche originale demande. En outre, pour la régression MCO, R ^ 2 est la corrélation au carré entre les valeurs prédites et les valeurs observées. Par conséquent, il doit être non négatif. Pour une régression MLS simple avec un prédicteur, cela équivaut à la corrélation au carré entre le prédicteur et la variable dépendante - là encore, elle doit être non négative.
Wolfgang
1
@ Whuber En effet. Ma faute; évidemment, je n'utilise pas SPSS - ni ne lis, apparemment :)
JMS
1
@ Whuber. J'ai ajouté un paragraphe soulignant qu'avec la régression linéaire, R2 ne peut être négatif que lorsque l'ordonnée à l'origine (ou peut-être la pente) est contrainte. Sans contrainte, le R2 doit être positif et égal au carré de r, le coefficient de corrélation.
Harvey Motulsky
1
@HarveyMotulsky, dans ce cas, l'interception ou la pente n'était pas contrainte. Il semble que vous disiez que Rsquared ne peut être négatif que si ceux-ci sont contraints. Pouvez-vous préciser ce qui aurait pu se passer dans ce cas particulier?
Anne
19

Avez-vous oublié d'inclure une interception dans votre régression? Je ne connais pas le code SPSS, mais à la page 21 de l'économétrie de Hayashi:

R2

R2=1-Σje=1neje2Σje=1n(yje-y¯)2

R2

Je vérifierais et m'assurerais que SPSS inclut une interception dans votre régression.

Jefflovejapan
la source
4
La sous-commande NOORIGIN dans son code indique que l'interception a été incluse dans le modèle
2011
2
c'est bizarre. J'aurais supposé que NOORIGINcela signifierait que l'interception n'est pas incluse dans le modèle, mais que le nom disparaît.
Matt O'Brien
6

Cela peut arriver si vous avez une série chronologique Niid et que vous construisez un modèle ARIMA inapproprié de la forme (0,1,0), qui est un modèle de marche aléatoire de première différence sans dérive, puis la variance (somme des carrés - SSE). des résidus sera plus grande que la variance (somme des carrés SSO) de la série originale. Ainsi, l'équation 1-SSE / SSO donnera un nombre négatif en tant que SSE exécute SSO. Nous l'avons vu lorsque les utilisateurs s'adaptent simplement à un modèle supposé ou utilisent des procédures inadéquates pour identifier / former une structure ARIMA appropriée. Le message plus large EST qu'un modèle peut déformer (tout comme une paire de mauvaises lunettes) votre vision. Sans avoir accès à vos données, j'aurais autrement du mal à expliquer vos résultats erronés. Avez-vous porté cela à l'attention d'IBM?

Harvey Motulsky a repris à son compte l'idée d'un modèle supposé contre-productif. Excellent post Harvey!

IrishStat
la source
1
stat. Merci. Non, je n'ai pas parlé à IBM. Les données ne sont pas des séries chronologiques. C'est à partir de données ponctuelles.
Anne
5
@ Anne et autres: Puisque vos données ne sont pas des séries chronologiques et que vous n'utilisez pas de procédure de série chronologique, veuillez ne pas tenir compte de ma réponse. D'autres personnes qui ont observé des carrés R négatifs lorsqu'elles étaient impliquées dans des séries chronologiques pourraient trouver mon article intéressant et informatif. D'autres ne peuvent malheureusement pas.
IrishStat
@IrishStat: Pourriez-vous s'il vous plaît ajouter un lien vers l'article de Harvey Motulsky?
kjetil b halvorsen
Harvey a répondu à la question ici.
IrishStat