augmentation des données lors de l'utilisation de flow_from_directory dans CNN

7

Je veux utiliser un petit ensemble de données pour créer un modèle CNN. Donc, j'utilise l'augmentation des données pour augmenter l'ensemble de données du train. Dois-je utiliser toutes les techniques d'augmentation (arguments) répertoriées ici ?

J'ai remarqué que l'ajout de nombreux arguments diminue la précision du modèle et rend l'ensemble d'entraînement plus difficile que l'ensemble de test.

Quelles sont les meilleures pratiques pour utiliser l'augmentation des données lors de l'utilisation flow_from_directory?

Noran
la source

Réponses:

6

Les augmentations dépendent souvent de la nature de vos données. Imaginez si le résultat d'une augmentation serait logique dans votre contexte.

Par exemple, supposons que vous ayez un ensemble de données chats vs chiens. Les images ici peuvent être inversées de gauche à droite. D'un autre côté, dans le jeu de données MNIST, cela n'a aucun sens de retourner les images (à quoi cela servirait-il d'alimenter un «3» inversé dans votre modèle). Certaines augmentations pourraient en fait confondre le modèle (par exemple, un «9» à l'envers pourrait ressembler à un «6»).

De plus, si l'augmérisation aggrave votre modèle, essayez des augmentations plus petites (par exemple, respectez les transformations affines avec de petites plages -[5 rotation / translation / mise à l'échelle).

ILM91
la source