Questions marquées «reinforcement-learning»

Un ensemble de stratégies dynamiques par lesquelles un algorithme peut apprendre la structure d'un environnement en ligne en prenant de manière adaptative des actions associées à différentes récompenses afin de maximiser les récompenses gagnées.

30
Apprentissage supervisé, apprentissage non supervisé et apprentissage par renforcement: principes de base du flux de travail

Enseignement supervisé 1) Un humain construit un classificateur basé sur des données d' entrée et de sortie 2) Ce classificateur est formé avec un ensemble de données de formation 3) Ce classificateur est testé avec un ensemble de données de test 4) Déploiement si le résultat est satisfaisant A...

25
Analyse quotidienne des séries chronologiques

J'essaie de faire une analyse des séries chronologiques et je suis nouveau dans ce domaine. J'ai un décompte quotidien d'un événement de 2006-2009 et je veux y adapter un modèle de série chronologique. Voici les progrès que j'ai réalisés: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25)...

19
Quand choisir SARSA vs Q Learning

SARSA et Q Learning sont tous deux des algorithmes d'apprentissage par renforcement qui fonctionnent de manière similaire. La différence la plus frappante est que SARSA est en politique alors que Q Learning est hors politique. Les règles de mise à jour sont les suivantes: Apprentissage Q:...

14
GAM vs LOESS vs splines

Contexte : Je veux tracer une ligne dans un nuage de points qui n'apparaît pas paramétrique, donc j'utilise geom_smooth()in ggplotin R. Il retourne automatiquement geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to...