Les bandes de confiance et de prédiction autour d'une régression non linéaire sont-elles censées être symétriques autour de la droite de régression? Cela signifie qu'ils ne prennent pas la forme d'un sablier comme dans le cas des bandes pour la régression linéaire. Pourquoi donc?
Voici le modèle en question:
Voici la figure:
et voici l'équation:
Réponses:
On s'attend à ce que les bandes de confiance et de prédiction s'élargissent généralement près des extrémités - et pour la même raison qu'elles le font toujours en régression ordinaire; généralement l'incertitude des paramètres conduit à des intervalles plus larges près des extrémités qu'au milieu
Vous pouvez le voir par simulation assez facilement, soit en simulant des données à partir d'un modèle donné, soit en simulant à partir de la distribution d'échantillonnage du vecteur de paramètres.
Les calculs habituels (approximativement corrects) effectués pour la régression non linéaire impliquent de prendre une approximation linéaire locale (cela est donné dans la réponse de Harvey), mais même sans ceux-ci, nous pouvons avoir une idée de ce qui se passe.
Cependant, faire les calculs réels n'est pas anodin et il se peut que les programmes prennent un raccourci de calcul qui ignore cet effet. Il est également possible que pour certaines données et certains modèles, l'effet soit relativement faible et difficile à voir. En effet, avec des intervalles de prédiction, en particulier avec une grande variance mais beaucoup de données, il peut parfois être difficile de voir la courbe dans une régression linéaire ordinaire - ils peuvent sembler presque droits, et il est relativement facile de discerner un écart par rapport à la rectitude.
Voici un exemple de la difficulté de voir juste avec un intervalle de confiance pour la moyenne (les intervalles de prédiction peuvent être beaucoup plus difficiles à voir parce que leur variation relative est tellement moindre). Voici quelques données et un ajustement des moindres carrés non linéaires, avec un intervalle de confiance pour la moyenne de la population (dans ce cas, généré à partir de la distribution d'échantillonnage puisque je connais le vrai modèle, mais quelque chose de très similaire pourrait être fait par approximation asymptotique ou par bootstrap):
Les limites violettes semblent presque parallèles aux prédictions bleues ... mais elles ne le sont pas. Voici l'erreur standard de la distribution d'échantillonnage de ces prévisions moyennes:
ce qui n'est clairement pas constant.
Éditer:
Ces expressions "sp" que vous venez de publier proviennent directement de l'intervalle de prédiction pour la régression linéaire !
la source
Y-hat +/- sp(Y-hat)
Les mathématiques du calcul de la confiance et des bandes de prédiction des courbes ajustées par régression non linéaire sont expliquées dans cette page de validation croisée. Cela montre que les bandes ne sont pas toujours / généralement symétriques.
Et voici une explication avec plus de mots et moins de mathématiques:
Tout d'abord, définissons G | x, qui est le gradient des paramètres à une valeur particulière de X et en utilisant toutes les valeurs les mieux ajustées des paramètres. Le résultat est un vecteur, avec un élément par paramètre. Pour chaque paramètre, il est défini comme dY / dP, où Y est la valeur Y de la courbe compte tenu de la valeur particulière de X et de toutes les valeurs de paramètre les mieux adaptées, et P est l'un des paramètres.)
G '| x est ce vecteur de gradient transposé, c'est donc une colonne plutôt qu'une ligne de valeurs. Cov est la matrice de covariance (Hesse inversée de la dernière itération). Il s'agit d'une matrice carrée avec un nombre de lignes et de colonnes égal au nombre de paramètres. Chaque élément de la matrice est la covariance entre deux paramètres. Nous utilisons Cov pour faire référence à la matrice de covariance normalisée , où chaque valeur est comprise entre -1 et 1.
Maintenant, calculez
Le résultat est un nombre unique pour toute valeur de X.
Les bandes de confiance et de prédiction sont centrées sur la courbe de meilleur ajustement et s'étendent au-dessus et au-dessous de la courbe d'une quantité égale.
Les bandes de confiance s'étendent au-dessus et au-dessous de la courbe:
Les bandes de prédiction s'étendent sur une distance supplémentaire au-dessus et en dessous de la courbe, égale à:
Dans ces deux équations, la valeur de c (définie ci-dessus) dépend de la valeur de X, de sorte que les bandes de confiance et de prédiction ne sont pas à une distance constante de la courbe. La valeur de SS est la somme des carrés de l'ajustement et DF est le nombre de degrés de liberté (nombre de points de données moins nombre de paramètres). CriticalT est une constante de la distribution t basée sur le niveau de confiance souhaité (traditionnellement 95%) et le nombre de degrés de liberté. Pour des limites de 95% et un df assez grand, cette valeur est proche de 1,96. Si DF est petit, cette valeur est plus élevée.
la source