Erreur additive ou erreur multiplicative?

13

Je suis relativement nouveau dans les statistiques et j'apprécierais de pouvoir mieux comprendre cela.

Dans mon domaine, il existe un modèle de formulaire couramment utilisé:

Pt=Po(Vt)α

Lorsque les gens adaptent le modèle aux données, ils le linéarisent généralement et correspondent aux éléments suivants

Journal(Pt)=Journal(Po)+αJournal(Vt)+ϵ

Est-ce correct? J'ai lu quelque part qu'en raison du bruit dans le signal, le modèle réel devrait être

Pt=Po(Vt)α+ϵ

et cela ne peut pas être linéarisé comme ci-dessus. Est-ce vrai? Dans l'affirmative, quelqu'un connaît-il une référence que je peux lire et en savoir plus et probablement citer dans un rapport?

ciaran_r
la source
J'ai formaté vos équations. Veuillez vérifier si le contenu correspond toujours à ce que vous vouliez (en particulier en ce qui concerne les abonnements).
Andy
Vous avez signalé votre question par "erreur de mesure" et le + e dans la 3ème équation semble être dû à une erreur de mesure additive en plus d'une variation multiplicative stochastique / aléatoire dans la réponse, quelque chose comme P * (V ^ alpha) * exp (e). Est-ce correct? Les modèles d'erreur de mesure (également appelés modèles "d'erreur dans les variables") nécessitent souvent une sorte de processus en deux étapes, qui dans votre cas peut nécessiter des données de validation distinctes pour caractériser l'erreur additive due au "bruit", auquel cas il peut ne pas y avoir de besoin de linéariser l'équation.
N Brouwer

Réponses:

14

Le modèle approprié dépend de la manière dont la variation autour de la moyenne entre dans les observations. Cela peut très bien venir de manière multiplicative ou additive ... ou d'une autre manière.

Il peut même y avoir plusieurs sources de cette variation, certaines qui peuvent entrer de manière multiplicative et certaines qui entrent de manière additive et d'autres d'une manière qui ne peut pas vraiment être caractérisée non plus.

Parfois, il existe une théorie claire pour établir celle qui convient. Parfois, la réflexion sur les principales sources de variation de la moyenne révèle un choix approprié. Souvent, les gens n'ont aucune idée claire de l'utilisation, ou si plusieurs sources de variation de différents types peuvent être nécessaires pour décrire correctement le processus.

Avec le modèle log-linéaire, où la régression linéaire est utilisée:

Journal(Pt)=log(Po)+αJournal(Vt)+ϵ

le modèle de régression OLS suppose une variance constante à l'échelle logarithmique, et si tel est le cas, les données d'origine montreront un écart croissant autour de la moyenne à mesure que la moyenne augmente.

En revanche, ce type de modèle:

Pt=Po(Vt)α+ϵ

est généralement ajusté par les moindres carrés non linéaires, et encore une fois, si la variance constante (la valeur par défaut pour NLS) est ajustée, alors l'écart autour de la moyenne doit être constant.

entrez la description de l'image ici

[Vous pouvez avoir l'impression visuelle que la propagation diminue avec l'augmentation de la moyenne dans la dernière image; c'est en fait une illusion causée par l'augmentation de la pente - nous avons tendance à juger la propagation orthogonale à la courbe plutôt que verticalement afin d'avoir une impression déformée.]

Si vous avez un écart presque constant sur l'échelle d'origine ou sur l'échelle logarithmique, cela pourrait suggérer lequel des deux modèles s'adapter, non pas parce qu'il prouve qu'il est additif ou multiplicatif, mais parce qu'il conduit à une description appropriée de l'écart ainsi que signifier.

Bien sûr, on pourrait également avoir la possibilité d'une erreur additive ayant une variance non constante.

Cependant, il existe encore d'autres modèles où de telles relations fonctionnelles peuvent être ajustées qui ont des relations différentes entre la moyenne et la variance (comme un GLM de Poisson ou quasi-Poisson, qui s'est propagé proportionnellement à la racine carrée de la moyenne).

Glen_b -Reinstate Monica
la source