J'utilise actuellement SVM et j'adapte mes fonctionnalités d'entraînement à la plage de [0,1]. J'ai d'abord ajusté / transformé mon ensemble d'entraînement, puis j'applique la même transformation à mon ensemble de test. Par exemple:
### Configure transformation and apply to training set
min_max_scaler = MinMaxScaler(feature_range=(0, 1))
X_train = min_max_scaler.fit_transform(X_train)
### Perform transformation on testing set
X_test = min_max_scaler.transform(X_test)
Supposons qu'une caractéristique donnée de l'ensemble d'apprentissage a une plage de [0,100] et que la même caractéristique de l'ensemble de test a une plage de [-10,120]. Dans l'ensemble d'apprentissage, cette fonctionnalité sera mise à l'échelle de manière appropriée à [0,1], tandis que dans l'ensemble de test, cette fonctionnalité sera mise à l'échelle dans une plage en dehors de la première spécifiée, quelque chose comme [-0,1,1,2].
Je me demandais quelles étaient les conséquences des fonctionnalités de l'ensemble de test hors de portée de celles utilisées pour former le modèle? Est-ce un problème?
la source
MinMaxScaler
.