Je suis relativement nouveau dans les statistiques et j'apprécierais de pouvoir mieux comprendre cela.
Dans mon domaine, il existe un modèle de formulaire couramment utilisé:
Lorsque les gens adaptent le modèle aux données, ils le linéarisent généralement et correspondent aux éléments suivants
Est-ce correct? J'ai lu quelque part qu'en raison du bruit dans le signal, le modèle réel devrait être
et cela ne peut pas être linéarisé comme ci-dessus. Est-ce vrai? Dans l'affirmative, quelqu'un connaît-il une référence que je peux lire et en savoir plus et probablement citer dans un rapport?
Réponses:
Le modèle approprié dépend de la manière dont la variation autour de la moyenne entre dans les observations. Cela peut très bien venir de manière multiplicative ou additive ... ou d'une autre manière.
Il peut même y avoir plusieurs sources de cette variation, certaines qui peuvent entrer de manière multiplicative et certaines qui entrent de manière additive et d'autres d'une manière qui ne peut pas vraiment être caractérisée non plus.
Parfois, il existe une théorie claire pour établir celle qui convient. Parfois, la réflexion sur les principales sources de variation de la moyenne révèle un choix approprié. Souvent, les gens n'ont aucune idée claire de l'utilisation, ou si plusieurs sources de variation de différents types peuvent être nécessaires pour décrire correctement le processus.
Avec le modèle log-linéaire, où la régression linéaire est utilisée:
le modèle de régression OLS suppose une variance constante à l'échelle logarithmique, et si tel est le cas, les données d'origine montreront un écart croissant autour de la moyenne à mesure que la moyenne augmente.
En revanche, ce type de modèle:
est généralement ajusté par les moindres carrés non linéaires, et encore une fois, si la variance constante (la valeur par défaut pour NLS) est ajustée, alors l'écart autour de la moyenne doit être constant.
[Vous pouvez avoir l'impression visuelle que la propagation diminue avec l'augmentation de la moyenne dans la dernière image; c'est en fait une illusion causée par l'augmentation de la pente - nous avons tendance à juger la propagation orthogonale à la courbe plutôt que verticalement afin d'avoir une impression déformée.]
Si vous avez un écart presque constant sur l'échelle d'origine ou sur l'échelle logarithmique, cela pourrait suggérer lequel des deux modèles s'adapter, non pas parce qu'il prouve qu'il est additif ou multiplicatif, mais parce qu'il conduit à une description appropriée de l'écart ainsi que signifier.
Bien sûr, on pourrait également avoir la possibilité d'une erreur additive ayant une variance non constante.
Cependant, il existe encore d'autres modèles où de telles relations fonctionnelles peuvent être ajustées qui ont des relations différentes entre la moyenne et la variance (comme un GLM de Poisson ou quasi-Poisson, qui s'est propagé proportionnellement à la racine carrée de la moyenne).
la source