top of page

Renforcement Learning

Ects : 2

Enseignant responsable : GABRIEL TURINICI


Volume horaire : 21

Description du contenu de l'enseignement :

  1. Introduction au reinforcement learning

  2. Formalisme théorique : « Markov decision processes » (MDP), function valeur ( équation de Belman et Hamilton- Jacobi – Bellman) etc.

  3. Stratégies usuelles, sur l’exemple de “multi-armed bandit”

  4. Stratégies en deep learning: Q-learning et DQN

  5. Stratégies en deep learning: SARSA et variantes

  6. Stratégies en deep learning: Actor-Critic et variantes

  7. Implémentations Python variées

  8. Perspectives.


Compétences à acquérir :

Introduction au deep reinforcement learning, avec une vision machine learning empirique: principaux algorithmes, implementations pratiques (gym)

bottom of page