Ce repo regroupe l'ensemble de mes formations sur l'apprentissage par renforcement, données notamment aux Automatants - l'association d'IA de CentraleSupélec https://automatants.cs-campus.fr/. Ce contenu est à but pédagogique, mais les codes corrigés sont des implémentations fonctionnelles des différents algorithmes.
Le dossier "Slides" regroupe les slides des formations, tandis que les codes sont disponibles directement à la racine. Ceux-ci sont séparés en canevas-corrigés : -> exemple : DQN_TP.py est le canevas pour le code du DQN tandis que DQN_TP_correction.py est le code complet.
Il est tout à fait possible que j'aie commis des erreurs dans les slides ou dans les implémentations. N'hésitez pas à lever une "Issue" dans ce cas.