Nous avons ajusté une fonction non linéaire aux données observées. La prochaine étape devrait être l'évaluation de la qualité de l'ajustement de cette fonction (comme pour les modèles linéaires).
Quels sont les moyens habituels de mesurer cela?
Modifier 1:
Le montage a été réalisé comme suit:
- Effectuer une régression linéaire avec des variables indépendantes A et B .
- Calculez les paramètres de distribution à partir des paramètres de régression. (La distribution est non linéaire et a la variable C en entrée.)
- Évaluer la qualité de l'ajustement de la distribution non linéaire en comparant les données estimées aux données observées.
Modifier 2:
Exemples pour les étapes mentionnées ci-dessus:
- Modèle de régression:
- et pour la distribution non linéaire suivante:
- Évaluer la qualité de l'ajustement de avec un ensemble donné d' observations .
Réponses:
Il y a peut-être plus, mais il me semble que vous voulez juste déterminer la qualité d'ajustement (GoF) pour une fonction f (a), adaptée à un ensemble de données particulier (a, f (a)). Donc, ce qui suit ne répond qu'à votre troisième sous-question (je ne pense pas que la première et la seconde soient directement pertinentes pour la troisième).
Habituellement, le GoF peut être déterminé de façon paramétrique (si vous connaissez les paramètres de la fonction de la distribution) ou non paramétrique (si vous ne les connaissez pas). Bien que vous puissiez être en mesure de comprendre les paramètres de la fonction, car elle semble être exponentielle ou gamma / Weibull (en supposant que les données sont continues). Néanmoins, je vais continuer, comme si vous ne connaissiez pas les paramètres. Dans ce cas, il s'agit d'un processus en deux étapes . Tout d'abord, vous devez déterminer les paramètres de distribution de votre ensemble de données. Deuxièmement, vous effectuez un test GoF pour la distribution définie. Pour éviter de me répéter, je vous renvoie à ce stade à ma réponse précédenteà une question connexe, qui contient des détails utiles. De toute évidence, cette réponse peut facilement être appliquée à des distributions, autres que celle mentionnée à l'intérieur.
En plus des tests GoF, mentionnés ici, vous pouvez envisager un autre test - le test GoF chi carré . Contrairement KS et AD tests, qui sont applicables uniquement aux distributions continues, test de chi-carré GoF est applicable à la fois discrets et continus petits. Le test GoF du chi carré peut être effectué dans R en utilisant l'un des packages suivants:
stats
package intégré (fonctionchisq.test()
) etvcd
package (fonctiongoodfit()
- pour les données discrètes uniquement). Plus de détails sont disponibles dans ce document .la source
Eh bien, dans l'apprentissage automatique, la chose appelée validation croisée est effectuée assez souvent à des fins de test de modèle (testez si ce type de modèle avec ces hyper-paramètres - comme le nombre de degrés de liberté ou autre - correspond à votre problème) - vous divisez votre plusieurs fois dans les ensembles de données d'entraînement et de test, puis exécutez l'optimisation sur l'ensemble de formation et calculez la qualité sur les données de test. Le moyen le plus confidentiel consiste à exécuter ce que l'on appelle la "validation croisée QxT-fold". Le pseudocode pourrait aimer:
la source