La validation-division dans la fonction d'ajustement du modèle Keras Sequential est documentée comme suit sur https://keras.io/models/sequential/ :
validation_split: Flotter entre 0 et 1. Fraction des données d'apprentissage à utiliser comme données de validation. Le modèle séparera cette fraction des données d'entraînement, ne s'entraînera pas dessus et évaluera la perte et toutes les métriques du modèle sur ces données à la fin de chaque époque. Les données de validation sont sélectionnées parmi les derniers échantillons dans les données x et y fournies, avant de les mélanger.
Veuillez noter la dernière ligne:
Les données de validation sont sélectionnées parmi les derniers échantillons dans les données x et y fournies, avant de les mélanger.
Cela signifie-t-il que les données de validation sont toujours fixes et extraites du bas de l'ensemble de données principal?
Existe-t-il un moyen de sélectionner au hasard une fraction donnée de données dans l'ensemble de données principal?
train_test_split
et maintenant vous confirmez que c'est une meilleure méthode car elle obtiendra au hasard des données de test / validation de l'ensemble de données.shuffle
paramètre, l'utiliseriez-vous égalementshuffle
dans le.fit
modèle pour un keras?