La page Wikipedia sur R2 dit que peut prendre une valeur supérieure à 1. Je ne vois pas comment cela est possible.
Des valeurs de dehors de la plage de 0 à 1 peuvent apparaître lorsqu'elles sont utilisées pour mesurer l'accord entre les valeurs observées et modélisées et lorsque les valeurs "modélisées" ne sont pas obtenues par régression linéaire et selon la formulation de utilisée. . Si la première formule ci-dessus est utilisée, les valeurs peuvent être inférieures à zéro. Si la deuxième expression est utilisée, les valeurs peuvent être supérieures à un.
Cette citation fait référence à la "deuxième expression" mais je ne vois pas de deuxième expression sur la page.
Y a-t-il un scénario où peut être supérieur à 1? Je pense à cette question pour la régression non linéaire, mais je voudrais obtenir une réponse générale.
[Pour quelqu'un qui regarde cette page avec la question opposée en tête: Oui; peut être négatif. Cela se produit lorsque vous ajustez un modèle qui correspond aux données pire qu'une ligne horizontale. Cela est généralement dû à une erreur dans la sélection d'un modèle ou de contraintes.]
la source
Réponses:
J'ai trouvé la réponse, je posterai donc la réponse à ma question. Comme l'a souligné Martijn, avec la régression linéaire, vous pouvez calculerR2 par deux expressions équivalentes:
Avec la régression non linéaire, vous ne pouvez pas additionner la somme des carrés des résidus et la somme des carrés de la régression pour obtenir la somme totale des carrés. Cette équation n'est tout simplement pas vraie. L'équation ci-dessus n'est donc pas correcte. Ces deux expériences calculent deux valeurs différentes pourR2 .
La seule équation qui a du sens et qui est (je pense) universellement utilisée est:
Sa valeur n'est jamais supérieure à 1,0, mais elle peut être négative lorsque vous ajustez le mauvais modèle (ou les mauvaises contraintes) de sorte que leSSe (somme des carrés des résidus) est supérieur à SSt (somme des carrés de la différence entre les valeurs Y réelles et moyennes).
L'autre équation n'est pas utilisée avec la régression non linéaire:
Mais si cette équation était utilisée, elle se traduit parR2 supérieur à 1,0 dans les cas où le modèle correspond très mal aux données afin SSm est plus grand que SSt . Cela se produit lorsque l'ajustement du modèle est pire que l'ajustement d'une ligne horizontale, les mêmes cas qui conduisent àR2 <0 avec l'autre équation.
Conclusion:R2 peut être supérieur à 1.0 uniquement lorsqu'une équation non valide (ou non standard) est utilisée pour calculer R2 et lorsque le modèle choisi (avec des contraintes, le cas échéant) correspond très mal aux données, pire que l'ajustement d'une ligne horizontale.
la source
Par définition,R2= 1 - SSe/ SSt où les deux termes SS sont une somme de carrés et donc non négatifs. Le maximum est atteint àSSe= 0 résultant en R2= 1 .
la source