Dans cette question - Existe - t-il une méthode pour construire des arbres de décision qui tienne compte des prédicteurs structurés / hiérarchiques / multiniveaux? - ils mentionnent une méthode de données de panel pour les arbres.
Existe-t-il des méthodes de données de panneau spécifiques pour prendre en charge les machines vectorielles et les réseaux de neurones? Si oui, pourriez-vous citer quelques articles pour les algorithmes et (si disponible) les packages R l'implémentant?
r
machine-learning
svm
panel-data
cart
Carlos Cinelli
la source
la source
Réponses:
LSTM (Long Short Term Memory) peut être pertinent pour vous. Ce type de modèle peut gérer plusieurs entités en plusieurs points dans le temps, ce qui devrait correspondre aux données du panneau. Voici une très belle explication sur le concept de LSTM, et voici un package qui implémente une version R de LSTM.
la source
Lorsque vous disposez de données de panel, vous pouvez essayer de résoudre différentes tâches, par exemple la classification / régression des séries chronologiques ou les prévisions de panel. Et pour chaque tâche, il existe de nombreuses approches pour la résoudre.
Lorsque vous souhaitez utiliser des méthodes d'apprentissage automatique pour résoudre les prévisions de panel, il existe un certain nombre d'approches:
En ce qui concerne vos données d'entrée (X), en traitant les unités (par exemple les pays, les individus, etc.) comme des échantillons iid, vous pouvez
En ce qui concerne vos données de sortie (y), si vous souhaitez prévoir plusieurs points dans le futur, vous pouvez
Toutes les approches ci-dessus réduisent essentiellement le problème de prévision des panels à un problème de régression de séries chronologiques ou de régression tabulaire. Une fois que vos données sont au format série chronologique ou régression tabulaire, vous pouvez également ajouter des fonctionnalités invariantes dans le temps pour les utilisateurs.
Bien sûr, il existe d'autres options pour résoudre le problème de prévision de panel, comme par exemple en utilisant des méthodes de prévision classiques comme ARIMA adaptées aux données de panel ou des méthodes d'apprentissage approfondi qui vous permettent de faire directement des prédictions de séquence en séquence.
la source