Combien de paramètres a un seul LSTM empilé? Le nombre de paramètres impose une limite inférieure au nombre d'exemples de formation requis et influence également le temps de formation. Par conséquent, connaître le nombre de paramètres est utile pour l'apprentissage de modèles utilisant des LSTM.
deep-learning
rnn
wabbit
la source
la source
Cependant, dans le cas où votre LSTM inclut des vecteurs biais ( par exemple , kera par défaut ), le nombre devient:
la source
Selon ceci :
Structure cellulaire LSTM
Équations LSTM
Non-linéarités d'ingénierie
Si l'entrée x_t est de taille n × 1 et qu'il y a d cellules mémoire, alors la taille de chacun de W ∗ et de U ∗ est d × n , et d × d resp. La taille de W sera alors 4d × (n + d) . Notez que chacune des cellules de mémoire dd a ses propres poids W ∗ et U ∗ , et que les seules valeurs de cellules de mémoire temporelles partagées avec d'autres unités LSTM sont pendant le produit avec U ∗ .
Merci à Arun Mallya pour son excellente présentation.
la source