La classification basée sur les réseaux neuronaux a-t-elle besoin d'une réduction de dimension?

9

J'utilise un classificateur basé sur les réseaux neuronaux pour exécuter une classification de mes données en n dimensions.

Ensuite, j'ai pensé que ce pourrait être une bonne idée d'exécuter une réduction de dimension comme PCA pour mes données au début, puis de mettre les résultats PCA dans le classificateur (je garde 3 PC). Cependant, la classification des entités à dimension réduite n'est pas aussi bonne que l'utilisation directe des entités à haute dimension d'origine.

Puis je suis tombé sur ce post NN en tant que DR1 qui a discuté des réseaux neuronaux comme méthode de réduction de dimension. De plus, certaines informations peuvent être trouvées dans cet article NN en tant que DR2, je suis confus maintenant:

  1. Si j'utilise la classification basée sur les réseaux neuronaux (dans Matlab), est-ce que cela réduit automatiquement la dimension pour moi?
  2. Dois-je exécuter une réduction de dimension comme l'APC avant d'exécuter la classification des réseaux neuronaux?
  3. Y a-t-il d'autres raisons pour lesquelles la classification des résultats de l'ACP n'est pas aussi bonne que l'utilisation des caractéristiques d'origine de grande dimension?
Samo Jerom
la source

Réponses:

18

En principe, la transformation linéaire effectuée par l'ACP peut également être effectuée par les poids de la couche d'entrée du réseau neuronal, elle n'est donc pas à proprement parler nécessaire. Cependant, à mesure que le nombre de pondérations dans le réseau augmente, la quantité de données nécessaires pour pouvoir déterminer de manière fiable les pondérations du réseau augmente également (souvent assez rapidement), et le sur-ajustement devient plus un problème (l'utilisation de la régularisation est également une bonne idée). L'avantage de la réduction de dimensionnalité est qu'elle réduit la taille du réseau, et donc la quantité de données nécessaires pour le former. L'inconvénient de l'utilisation de PCA est que les informations discriminantes qui distinguent une classe d'une autre peuvent se trouver dans les composants à faible variance, de sorte que l'utilisation de PCA peut aggraver les performances.

Comme la plupart des choses dans la reconnaissance des formes statistiques, il n'y a pas de recette unique qui fonctionne de manière fiable pour tous les problèmes, et la meilleure chose à faire est d'essayer les deux approches et de voir celle qui fonctionne le mieux.

Dikran Marsupial
la source
1

Si j'utilise la classification basée sur les réseaux neuronaux (dans Matlab), est-ce que cela réduit automatiquement la dimension pour moi? Réponse: si vous utilisez plus d'une couche pour la classification et que le nombre de neurones dans la couche cachée est inférieur aux neurones d'entrée, vous avez donc une sorte de réseau neuronal de réduction dimensionnelle. si dans l'image n> m vous avez un réseau de réduction de dimension mais ce n'est peut-être pas un PCA.

mohammad amiri
la source
0

Étant donné que le réseau neuronal peut approximer toute cartographie non linéaire grâce à l'apprentissage et qu'il est exempt des contraintes d'un modèle non linéaire, il n'était pas nécessaire de réduire à l'avance la dimension comme l'ACP. Cela montre également que le réseau neuronal artificiel (ANN) a une forte puissance de calcul non linéaire.

ywj_huang
la source