Disons que nous voulons faire une régression pour simple en f = x * y
utilisant un réseau de neurones profond standard.
Je me souviens qu'il y a des reseraches qui disent que NN avec une couche cachée peut apoximer n'importe quelle fonction, mais j'ai essayé et sans normalisation NN n'a pas pu approximer même cette simple multiplication. Seule la normalisation du journal des données a aidé m = x*y => ln(m) = ln(x) + ln(y).
Mais cela ressemble à une triche. NN peut-il le faire sans normalisation des journaux? La réponse est évidemment (comme pour moi) - oui, donc la question est plutôt de savoir quel devrait être le type / la configuration / la disposition d'un tel NN?