Forme de confiance et intervalles de prédiction pour la régression non linéaire

13

Les bandes de confiance et de prédiction autour d'une régression non linéaire sont-elles censées être symétriques autour de la droite de régression? Cela signifie qu'ils ne prennent pas la forme d'un sablier comme dans le cas des bandes pour la régression linéaire. Pourquoi donc?

Voici le modèle en question: Voici la figure:

F(X)=(UNE-1+(XC)B)+

http://i57.tinypic.com/2q099ok.jpg

et voici l'équation:

entrez la description de l'image ici

Serge
la source
Votre question n'est pas claire, car vous passez de demander s'ils sont "censés être symétriques" dans la 1ère phrase, à impliquer qu'ils ne sont pas dans la phrase 2 et demander (vraisemblablement) pourquoi ils ne sont pas dans la phrase 3. Pouvez-vous faire ce plus cohérent / clair?
gung - Reinstate Monica
OK, permettez-moi de le demander de cette façon - pourquoi les bandes de confiance et de prédiction sont-elles symétriques autour de la ligne de régression lorsque la régression est non linéaire mais prennent une forme de sablier lorsqu'elle est linéaire?
Serge
00
Tu as raison. Le groupe traverse le territoire négatif. Cependant, je ne suis pas intéressé par les valeurs des bandes elles-mêmes, mais plutôt par les valeurs EC50 correspondant aux limites de bande. Y a-t-il une alternative à la construction des groupes de cette façon?
Serge
Oui, mais comme je l'ai laissé entendre, cela peut se compliquer. Les moindres carrés généralisés et les méthodes de séries chronologiques peuvent gérer la corrélation en série. Les transformations non linéaires de la variable dépendante sont un outil pour gérer les erreurs non additives. Un outil plus sophistiqué est un modèle linéaire généralisé. Les choix dépendent en partie de la nature de la variable dépendante. BTW, bien que je ne sois pas sûr de ce que vous entendez par "valeurs EC50" (il semble que vous modélisez des relations dose-réponse), tout ce qui est calculé à partir des bandes illustrées sera suspect.
whuber

Réponses:

8

On s'attend à ce que les bandes de confiance et de prédiction s'élargissent généralement près des extrémités - et pour la même raison qu'elles le font toujours en régression ordinaire; généralement l'incertitude des paramètres conduit à des intervalles plus larges près des extrémités qu'au milieu

Vous pouvez le voir par simulation assez facilement, soit en simulant des données à partir d'un modèle donné, soit en simulant à partir de la distribution d'échantillonnage du vecteur de paramètres.

Les calculs habituels (approximativement corrects) effectués pour la régression non linéaire impliquent de prendre une approximation linéaire locale (cela est donné dans la réponse de Harvey), mais même sans ceux-ci, nous pouvons avoir une idée de ce qui se passe.

Cependant, faire les calculs réels n'est pas anodin et il se peut que les programmes prennent un raccourci de calcul qui ignore cet effet. Il est également possible que pour certaines données et certains modèles, l'effet soit relativement faible et difficile à voir. En effet, avec des intervalles de prédiction, en particulier avec une grande variance mais beaucoup de données, il peut parfois être difficile de voir la courbe dans une régression linéaire ordinaire - ils peuvent sembler presque droits, et il est relativement facile de discerner un écart par rapport à la rectitude.

Voici un exemple de la difficulté de voir juste avec un intervalle de confiance pour la moyenne (les intervalles de prédiction peuvent être beaucoup plus difficiles à voir parce que leur variation relative est tellement moindre). Voici quelques données et un ajustement des moindres carrés non linéaires, avec un intervalle de confiance pour la moyenne de la population (dans ce cas, généré à partir de la distribution d'échantillonnage puisque je connais le vrai modèle, mais quelque chose de très similaire pourrait être fait par approximation asymptotique ou par bootstrap):

entrez la description de l'image ici

Les limites violettes semblent presque parallèles aux prédictions bleues ... mais elles ne le sont pas. Voici l'erreur standard de la distribution d'échantillonnage de ces prévisions moyennes:

entrez la description de l'image ici

ce qui n'est clairement pas constant.


Éditer:

Ces expressions "sp" que vous venez de publier proviennent directement de l'intervalle de prédiction pour la régression linéaire !

Glen_b -Reinstate Monica
la source
dites-vous également que l'augmentation de l'incertitude des paramètres à mesure que l'on s'éloigne du centre devrait entraîner un élargissement de la bande aux extrémités même dans le cas d'une régression non linéaire, mais qu'elle n'est tout simplement pas aussi évidente? Ou y a-t-il une raison théorique pour laquelle cet élargissement ne se produit pas dans le cas d'une régression non linéaire? Mes groupes ont certainement l'air très symétriques.
Serge
1
Cet élargissement se produirait devrait être typique, mais il ne se produira pas de la même manière avec tous les modèles non linéaires et ne sera pas aussi évident avec tous les modèles, et parce que ce n'est pas aussi facile à faire, il se peut qu'il ne soit pas calculé de cette façon par un programme donné . Je ne sais pas comment les bandes que vous regardez ont été calculées - je ne suis pas un lecteur d'esprit, et je ne vois pas le code d'un programme dont vous n'avez même pas mentionné le nom.
Glen_b -Reinstate Monica
@ user1505202, cela reste une question difficile à répondre complètement. Pouvez-vous indiquer quel est votre modèle (sa forme fonctionnelle)? Pouvez-vous joindre une image de la figure qui vous laisse perplexe?
gung - Reinstate Monica
1
Merci. J'ai les chiffres et ils sont essentiellement constants - la différence entre la droite de régression et chaque limite de prédiction varie de 18,21074 au milieu à 18,24877 aux extrémités. Donc, un léger élargissement, mais très léger. Au fait, @gung, j'ai eu l'équation qui calcule l'intervalle de prédiction. C'est:Y-hat +/- sp(Y-hat)
Serge
1
C'est à peu près le genre de variation que vous pourriez voir avec un intervalle de prédiction avec de plus grands échantillons. Quel est sp?
Glen_b -Reinstate Monica
5

Les mathématiques du calcul de la confiance et des bandes de prédiction des courbes ajustées par régression non linéaire sont expliquées dans cette page de validation croisée. Cela montre que les bandes ne sont pas toujours / généralement symétriques.

Et voici une explication avec plus de mots et moins de mathématiques:

Tout d'abord, définissons G | x, qui est le gradient des paramètres à une valeur particulière de X et en utilisant toutes les valeurs les mieux ajustées des paramètres. Le résultat est un vecteur, avec un élément par paramètre. Pour chaque paramètre, il est défini comme dY / dP, où Y est la valeur Y de la courbe compte tenu de la valeur particulière de X et de toutes les valeurs de paramètre les mieux adaptées, et P est l'un des paramètres.)

G '| x est ce vecteur de gradient transposé, c'est donc une colonne plutôt qu'une ligne de valeurs. Cov est la matrice de covariance (Hesse inversée de la dernière itération). Il s'agit d'une matrice carrée avec un nombre de lignes et de colonnes égal au nombre de paramètres. Chaque élément de la matrice est la covariance entre deux paramètres. Nous utilisons Cov pour faire référence à la matrice de covariance normalisée , où chaque valeur est comprise entre -1 et 1.

Maintenant, calculez

c = G '| x * Cov * G | x.

Le résultat est un nombre unique pour toute valeur de X.

Les bandes de confiance et de prédiction sont centrées sur la courbe de meilleur ajustement et s'étendent au-dessus et au-dessous de la courbe d'une quantité égale.

Les bandes de confiance s'étendent au-dessus et au-dessous de la courbe:

= sqrt (c) * sqrt (SS / DF) * CriticalT (% de confiance, DF)

Les bandes de prédiction s'étendent sur une distance supplémentaire au-dessus et en dessous de la courbe, égale à:

= sqrt (c + 1) * sqrt (SS / DF) * CriticalT (% de confiance, DF)

Dans ces deux équations, la valeur de c (définie ci-dessus) dépend de la valeur de X, de sorte que les bandes de confiance et de prédiction ne sont pas à une distance constante de la courbe. La valeur de SS est la somme des carrés de l'ajustement et DF est le nombre de degrés de liberté (nombre de points de données moins nombre de paramètres). CriticalT est une constante de la distribution t basée sur le niveau de confiance souhaité (traditionnellement 95%) et le nombre de degrés de liberté. Pour des limites de 95% et un df assez grand, cette valeur est proche de 1,96. Si DF est petit, cette valeur est plus élevée.

Harvey Motulsky
la source
Merci, Harvey. Je travaille à obtenir le gradient des paramètres de ma fonction. Connaissez-vous par hasard un exemple concret, car je ne sais pas non plus comment la matrice de covariance est obtenue.
Serge
Si vous utilisez la démo GraphPad Prism, vous pouvez ajuster les données au modèle de votre choix et afficher la matrice de covariance (un résultat facultatif choisi dans l'onglet Diagnostics) et les bandes de confiance ou de prédiction (sous forme de nombres et de graphique; choisissez également dans Onglet Diagnostics). Ce n'est pas un bon exemple, mais au moins vous pouvez comparer la matrice de covariance et voir si le problème est avant ou après ...
Harvey Motulsky
Deux choses, cependant. 1. Prism m'a donné la matrice Cov. Cependant, il ne s'agit que d'un numéro pour l'ensemble de données complet. Suis-je pas censé obtenir une valeur par valeur X? 2. J'obtiens la bande de prédiction dans le graphique mais j'aimerais que la sortie contienne les valeurs. Le prisme ne semble pas faire cela. Je suis très nouveau chez Prism et donc je n'ai peut-être pas cherché partout, mais j'ai essayé!
Serge
1. La matrice de covariance montre le degré d’interdépendance des paramètres. Il y a donc une valeur pour chaque paire de paramètres que vous demandez à la régression non linéaire de s'adapter. 2. Regardez sur l'onglet Plage pour demander à Prism de faire un tableau des coordonnées XY de la courbe, avec des valeurs plus / moins pour les bandes de confiance ou de prédiction. 3. Pour le support technique avec Prism, envoyez un e-mail à [email protected] Utilisez ce forum pour des questions statistiques, pas pour le support technique.
Harvey Motulsky