Étude de l'apprentissage par renforcement profond sur Pendulum

Vous avez à disposition ici du github du projet Etude de l'apprentissage par renforcement profond sur Pendulum dans le cadre de l'unité d'enseignement P-ANDROIDE.

Le dossier Basic Policy Graident Lab contient l'implémentation de l'algorithme Policy Gradient. Voici le lien original détaillant son utilisation : https://github.com/osigaud/Basic-Policy-Gradient-Labs

Les dossiers stable baselines 3 contiennent les implémentations des algorithmes d'apprentissage par renforcement dans lesquels nous avons effectués des modifications pour notre étude par ablation. Il est donc possible qu'il y ait des bugs mineurs. Néanmoins, voici le lien original de stable baselines 3 où vous avez également une explication sur son utilisation : https://github.com/DLR-RM/stable-baselines3

Dans les dossiers stable baselines 3, les politiques obtenues par nos expériences sont sauvegardées dans les dossiers /tests/log . L'implémentation des fonctions d'affichages se trouvent également dedans (plot.py).

Les résultats de notre étude par ablation sont disposibles dans le dossier Experimental results.

Le rapport du projet est quant à lui disponible dans le dossier Ressources.

Enfin, voici le lien de notre vidéo concernant la présentation de notre projet : https://drive.google.com/drive/folders/1FslJ9VmcYSbL8w7sjeQ0notSl8-W7cDv?usp=sharing

Si vous avez des questions, vous pouvez nous envoyer aux mails suivants :
Vincent Fu : vincent.fu@etu.sorbonne-universite.fr
Yuhao Liu : yu-hao.liu@etu.sorbonne-universite.fr

Name		Name	Last commit message	Last commit date
Latest commit History 104 Commits
Basic-Policy-Gradient-Labs-master		Basic-Policy-Gradient-Labs-master
Experimental results		Experimental results
Ressources		Ressources
Results_test		Results_test
stable-baselines3-master		stable-baselines3-master
stable-baselines3-master_conitugue		stable-baselines3-master_conitugue
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Étude de l'apprentissage par renforcement profond sur Pendulum

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

vcentfu/ReinfLearnPendulum

Folders and files

Latest commit

History

Repository files navigation

Étude de l'apprentissage par renforcement profond sur Pendulum

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages