Projet M1 - Implémentation et Étude de Discrete Soft Actor-Critic avec BBRL

Ce projet a été réalisé dans le cadre de l'UE Projet ANDROIDE du Master 1 Informatique (parcours AI2D) à Sorbonne Université.

Objectif

L’objectif du projet est de :

Prendre en main la bibliothèque BBRL (Black-Box Reinforcement Learning),
Implémenter plusieurs algorithmes de Deep Reinforcement Learning classiques (DQN, DDQN, DDPG, TD3, SAC),
Réaliser une version discrète de l'algorithme Soft Actor-Critic (DSAC),
Étudier expérimentalement le comportement de l'actor et du critic.

Structure du projet

DDPG/, DQN/, SAC/, TD3Discret/ - Contiennent des notebooks explicatifs pour chaque algorithme implémenté, permettant de mieux comprendre leur fonctionnement et leur entraînement avec BBRL.
DSAC/
- Contient l’implémentation complète et les expériences menées sur Discrete Soft Actor-Critic (DSAC) :
- src/ : Fichiers source Python de l’implémentation.
- docs/ : Résultats numériques (logs, récompenses, meilleurs hyperparamètres, etc.).
- outputs/ : Répertoires générés par BBRL (logs, modèles, etc.).
- plot/ : Graphiques et figures issues des études expérimentales.

Librairies utilisées

BBRL (bbrl_utils)
Gymnasium
Optuna
PyTorch
Matplotlib

Encadrants

Olivier Sigaud (ISIR, Sorbonne Université)

Auteurs

Simon Groc
Yassin Lahbib

Name		Name	Last commit message	Last commit date
Latest commit History 42 Commits
DDPG		DDPG
DQN		DQN
DSAC		DSAC
SAC		SAC
TD3Discret		TD3Discret
README.md		README.md
cahier_des_charges_DSAC.pdf		cahier_des_charges_DSAC.pdf
rapport_PANDROIDE.pdf		rapport_PANDROIDE.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projet M1 - Implémentation et Étude de Discrete Soft Actor-Critic avec BBRL

Objectif

Structure du projet

Librairies utilisées

Encadrants

Auteurs

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Projet M1 - Implémentation et Étude de Discrete Soft Actor-Critic avec BBRL

Objectif

Structure du projet

Librairies utilisées

Encadrants

Auteurs

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages