Quelle est l'importance de la distinction entre modèles linéaires et non linéaires? La question du modèle linéaire non linéaire ou généralisé: comment référez-vous à la régression logistique, Poisson, etc.? et sa réponse a été une clarification extrêmement utile de la linéarité / non-linéarité des modèles linéaires généralisés. Il semble extrêmement important de distinguer les modèles linéaires des modèles non linéaires, mais je ne comprends pas pourquoi. Par exemple, considérez ces modèles de régression:
Les modèles 1 et 2 sont linéaires et les solutions à existent sous forme fermée, faciles à trouver à l'aide d'un estimateur OLS standard. Ce n'est pas le cas pour les modèles 3 et 4, qui sont non linéaires car (certaines) les dérivées de E [ Y ∣ X ] par rapport à β sont toujours des fonctions de β .
Une solution simple pour estimer dans le modèle 3 consiste à linéariser le modèle en définissant γ = β 2 1 , à estimer γ à l' aide d'un modèle linéaire, puis à calculer β 1 = √ .
Pour estimer les paramètres du modèle 4, nous pouvons supposer que suit une distribution binomiale (membre de la famille exponentielle) et, en utilisant le fait que la forme logistique du modèle est le lien canonique, linéariser les valeurs rh du modèle. C'était la contribution majeure de Nelder et Wedderburn .
Mais pourquoi cette non-linéarité est-elle un problème en premier lieu? Pourquoi ne peut-on pas simplement utiliser un algorithme itératif pour résoudre le modèle 3 sans linéariser à l'aide de la fonction racine carrée, ou le modèle 4 sans invoquer les GLM. Je soupçonne qu'avant la puissance de calcul généralisée, les statisticiens essayaient de tout linéariser. Si c'est vrai, alors peut-être que les "problèmes" introduits par la non-linéarité sont un vestige du passé? Les complications introduites par les modèles non linéaires sont-elles simplement informatiques, ou y a-t-il d'autres problèmes théoriques qui rendent les modèles non linéaires plus difficiles à ajuster aux données que les modèles linéaires?
la source
Réponses:
Je peux voir deux différences principales:
la linéarité le rend simple et robuste. Par exemple, l'OLS (linéaire) est un estimateur sans biais sous une distribution de perturbation inconnue. En général, les modèles GLM et non linéaires ne le sont pas. OLS est également robuste pour divers modèles de structure d'erreur (effets aléatoires, regroupement, etc.) où, dans les modèles non linéaires, vous devez généralement assumer la distribution exacte de ces termes.
Le résoudre est facile: juste quelques multiplications matricielles + 1 inverse. Cela signifie que vous pouvez presque toujours le résoudre, même dans les cas où la fonction objectif est presque plate (multicolinéarité). Les méthodes itératives peuvent ne pas converger dans de tels cas problématiques (ce qui, dans un sens, est une bonne chose.) Une résolution facile peut ou peut pas moins un problème de nos jours. Les ordinateurs deviennent plus rapides, mais les données augmentent. Avez-vous déjà essayé d'exécuter une régression logit sur des observations 1G?
En plus de cela, les modèles linéaires sont plus faciles à interpréter. Dans les modèles linéaires, les effets marginaux sont égaux aux coefficients et sont indépendants des valeurs X (bien que les termes polynomiaux gâchent cette simplicité.)
la source
De nombreux modèles en biologie (et dans d'autres domaines) ne sont pas linéaires, ils conviennent donc mieux à la régression non linéaire. Le calcul est très différent, bien sûr. Mais du point de vue de l'analyste de données, il n'y a vraiment qu'une seule différence importante.
La régression non linéaire nécessite des valeurs estimées initiales pour chaque paramètre. Si ces estimations initiales sont éloignées, le programme de régression non linéaire peut converger vers un faux minimum et donner des résultats inutiles ou trompeurs.
la source
Je vais tout d'abord substituer le mot «modèle» au mot «régression». Je pense que pour les deux mots, on se demande vraiment quelles sont les équations pertinentes qui définissent le modèle et quelles sont les hypothèses pertinentes reliant les valeurs de la variable dépendante et les valeurs prédites par l'équation / modèle. Je pense que le terme «modèle» est plus standard. Si vous êtes d'accord avec cela, lisez la suite.
la source