Je suis tombé sur une question simple sur la comparaison des modèles flexibles (c'est-à-dire des splines) et des modèles inflexibles (par exemple la régression linéaire) dans différents scénarios. La question est:
En général, nous attendons-nous à ce que les performances d'une méthode d'apprentissage statistique flexible soient meilleures ou moins bonnes qu'une méthode inflexible lorsque:
- Le nombre de prédicteurs est extrêmement grand et le nombre d'observations est petit?
- La variance des termes d'erreur, c'est-à-dire , est extrêmement élevée?
Je pense que pour (1), quand est petit, les modèles inflexibles sont meilleurs (pas sûr). Pour (2), je ne sais pas quel modèle est (relativement) meilleur.
machine-learning
model
un petit garçon
la source
la source
Réponses:
Dans ces 2 situations, les performances comparatives flexibles vs inflexibles dépendent également:
Si la relation est proche de la linéarité et que vous ne contraignez pas la flexibilité, le modèle linéaire devrait donner une meilleure erreur de test dans les deux cas car le modèle flexible est susceptible de s'adapter dans les deux cas.
Vous pouvez le voir comme ça:
Si toutefois la vraie relation est très non linéaire, il est difficile de dire qui gagnera (les deux perdront :)).
Si vous ajustez / limitez le degré de flexibilité et le faites de la bonne manière (par exemple par validation croisée), le modèle flexible devrait gagner dans tous les cas.
la source
Bien sûr, cela dépend des données sous-jacentes que vous devez toujours explorer pour découvrir certaines de ses caractéristiques avant d'essayer d'adapter un modèle, mais ce que j'ai appris comme règles générales sont:
la source
Eh bien, pour la deuxième partie, je pense qu'un modèle plus flexible tentera de s'adapter au modèle dur et que les données de formation contiennent un bruit élevé, donc le modèle flexible tentera également d'apprendre ce bruit et entraînera plus d'erreur de test. Je connais la source de cette question car je lis aussi le même livre :)
la source
Pour la première partie, je m'attendrais à ce que le modèle inflexible fonctionne mieux avec un nombre limité d'observations. Lorsque n est très petit, les deux modèles (qu'il soit flexible ou rigide) ne fourniraient pas une prédiction suffisamment bonne. Cependant, le modèle flexible aurait tendance à surajuster les données et à donner de meilleurs résultats lorsqu'il s'agit d'un nouveau jeu de tests.
Idéalement, je collecterais plus d'observations pour améliorer l'ajustement, mais si ce n'est pas le cas, j'utiliserais le modèle inflexible, essayant de minimiser une erreur de test avec un nouveau jeu de test.
la source
Pour la deuxième question, je pense que la réponse est que les deux fonctionneront également (en supposant que ces erreurs sont irréductibles, c'est-à-dire cette erreur). Plus d'informations sont fournies dans Introduction à l'apprentissage statistique à la page 18 (sujet: Pourquoi estimer ) où l'auteur explique en disantF
la source
Pour chacune des parties (a) à (d), indiquez si i. ou ii. est correct et expliquez votre réponse. En général, nous attendons-nous à ce que les performances d'une méthode d'apprentissage statistique flexible soient meilleures ou moins bonnes qu'une méthode inflexible lorsque:
La taille de l'échantillon n est extrêmement grande et le nombre de prédicteurs p est petit?
Le nombre de prédicteurs p est extrêmement grand et le nombre d'observations n est petit?
La relation entre les prédicteurs et la réponse est fortement non linéaire?
La variance des termes d'erreur, c'est-à-dire σ2 = Var (ε), est extrêmement élevée?
Pris d' ici .
la source