J'ai un modèle non linéaire , où est le cdf de la distribution normale standard et f est non linéaire (voir ci-dessous). Je veux tester la qualité de l'ajustement de ce modèle avec le paramètre à mes données , après avoir utilisé l'estimation du maximum de vraisemblance pour trouver . Quel serait un test approprié? Je voudrais utiliser ce test pour étiqueter un mauvais ajustement comme mauvais et déterminer si davantage de données doivent être collectées.Φ a ( x 1 , y 1 ) , ( x 2 , y 2 ) , … , ( x n , y n ) a
J'ai étudié l'utilisation de la déviance, qui compare ce modèle au modèle saturé, avec son test de qualité d'ajustement correspondant en utilisant la . Serait-ce approprié? La plupart de ce que j'ai lu sur la déviance l'applique aux GLM, ce qui n'est pas ce que j'ai. Si le test de déviance est approprié, quelles hypothèses doivent être retenues pour rendre le test valide?
Mise à jour: pour au cas où cela aiderait. x>1,a>0
la source
Réponses:
Utilisez le package "npcmstest" dans la bibliothèque "NP" si vous utilisez la plateforme R. Avertissement: La fonction peut prendre plusieurs minutes pour évaluer votre modèle.
Vous pouvez également envisager une comparaison théorique de l'information de la distribution de la réponse et de la distribution prédictive (c.-à-d. Divergence KL, entropie croisée, etc.)
la source
lm
ouglm
. Comment cela fonctionnerait-il pour un modèle non linéaire? (Oui, j'utilise R.) J'ai ajouté ce que est à ma question au cas où cela aiderait.gam
ou similaire (mgcv
package)? Sinon, vous devriez le vérifier.Voici comment je le ferais, essentiellement un test de rapport de vraisemblance. Mais rappelez-vous qu'ils "clé" pour comprendre un test d'adéquation, c'est de comprendre la classe d'alternatives que vous testez. Maintenant, nous avons la probabilité pour chaque point de données individuel que:
Où est la probabilité du terme d'erreur dans votre modèle, et est la prédiction du modèle pour le ième point de données, étant donné et . Maintenant, pour chaque point de données nous pouvons choisir un tel que - le "modèle saturé" comme vous l'appelez. Donc, votre est approprié ici, si vous ne voulez tester que des alternatives dans la classe de ceux avec la même probabilité d'erreur, , et vous avez l'indépendance de chacune des probabilités (c'est-à-dire connaître un autre ne serait d'aucune aide pour prédiref i = x i - 1g(ϵ) xia(xi,yi)afi=yiχ2g(ϵ)xj,yjyiafi=xi−1ax2i+1√ xi a (xi,yi) a fi=yi χ2 g(ϵ) xj,yj yi , étant donné ). a
la source
Dans un contexte de régression linéaire, les tests de qualité de l'ajustement sont souvent menés contre une alternative plus compliquée. Vous avez une régression linéaire - ajoutez quelques termes polynomiaux pour tester si la forme linéaire est suffisante. Puisque vous avez déjà une forme fonctionnelle non linéaire, l'alternative compliquée que vous devrez considérer devrait être celle de la régression non paramétrique . Je n'essaierai pas de fournir une introduction au sujet, car il nécessite un état d'esprit qui lui est propre, et cela vaut une introduction appropriée distincte. Pour le test des régressions paramétriques vs non paramétriques, Wooldridge (1992) ou Hardle et Mammen (1993) , ils font des choses très similaires. Hardle a également écrit un excellent livre sur le sujet.
la source