Dans l'apprentissage automatique de base, nous apprenons les «règles de base» suivantes:
a) la taille de vos données doit être au moins 10 fois supérieure à la dimension VC de votre ensemble d'hypothèses.
b) un réseau neuronal avec N connexions a une dimension VC d'environ N.
Ainsi, lorsqu'un réseau neuronal d'apprentissage en profondeur a, par exemple, des millions d'unités, cela signifie-t-il que nous devrions avoir, disons, des milliards de points de données? Pouvez-vous nous éclairer à ce sujet?
Réponses:
La règle d'or dont vous parlez ne peut pas être appliquée à un réseau de neurones.
Un réseau de neurones possède certains paramètres de base, à savoir ses poids et ses biais. Le nombre de poids dépend du nombre de connexions entre les couches du réseau et le nombre de biais dépend du nombre de neurones.
La taille des données requises dépend fortement de -
Cela étant dit, le moyen le plus approprié et le plus sûr de savoir si le modèle est trop adapté est de vérifier si l'erreur de validation est proche de l'erreur d'apprentissage. Si oui, alors le modèle fonctionne bien. Si non, le modèle est probablement sur-adapté et cela signifie que vous devez réduire la taille de votre modèle ou introduire des techniques de régularisation.
la source