Skip to content

[Reinforcement Learning, forked from Stable-baselines3] Étude des performances des algorithmes de Reinforcement Learning sur Pendulum

Notifications You must be signed in to change notification settings

vcentfu/ReinfLearnPendulum

Repository files navigation

Étude de l'apprentissage par renforcement profond sur Pendulum

Vous avez à disposition ici du github du projet Etude de l'apprentissage par renforcement profond sur Pendulum dans le cadre de l'unité d'enseignement P-ANDROIDE.

Le dossier Basic Policy Graident Lab contient l'implémentation de l'algorithme Policy Gradient. Voici le lien original détaillant son utilisation : https://github.com/osigaud/Basic-Policy-Gradient-Labs

Les dossiers stable baselines 3 contiennent les implémentations des algorithmes d'apprentissage par renforcement dans lesquels nous avons effectués des modifications pour notre étude par ablation. Il est donc possible qu'il y ait des bugs mineurs. Néanmoins, voici le lien original de stable baselines 3 où vous avez également une explication sur son utilisation : https://github.com/DLR-RM/stable-baselines3

Dans les dossiers stable baselines 3, les politiques obtenues par nos expériences sont sauvegardées dans les dossiers /tests/log . L'implémentation des fonctions d'affichages se trouvent également dedans (plot.py).

Les résultats de notre étude par ablation sont disposibles dans le dossier Experimental results.

Le rapport du projet est quant à lui disponible dans le dossier Ressources.

Enfin, voici le lien de notre vidéo concernant la présentation de notre projet : https://drive.google.com/drive/folders/1FslJ9VmcYSbL8w7sjeQ0notSl8-W7cDv?usp=sharing

Si vous avez des questions, vous pouvez nous envoyer aux mails suivants :
Vincent Fu : vincent.fu@etu.sorbonne-universite.fr
Yuhao Liu : yu-hao.liu@etu.sorbonne-universite.fr

About

[Reinforcement Learning, forked from Stable-baselines3] Étude des performances des algorithmes de Reinforcement Learning sur Pendulum

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages