Vous avez à disposition ici du github du projet Etude de l'apprentissage par renforcement profond sur Pendulum dans le cadre de l'unité d'enseignement P-ANDROIDE.
Le dossier Basic Policy Graident Lab contient l'implémentation de l'algorithme Policy Gradient. Voici le lien original détaillant son utilisation : https://github.com/osigaud/Basic-Policy-Gradient-Labs
Les dossiers stable baselines 3 contiennent les implémentations des algorithmes d'apprentissage par renforcement dans lesquels nous avons effectués des modifications pour notre étude par ablation. Il est donc possible qu'il y ait des bugs mineurs. Néanmoins, voici le lien original de stable baselines 3 où vous avez également une explication sur son utilisation : https://github.com/DLR-RM/stable-baselines3
Dans les dossiers stable baselines 3, les politiques obtenues par nos expériences sont sauvegardées dans les dossiers /tests/log . L'implémentation des fonctions d'affichages se trouvent également dedans (plot.py).
Les résultats de notre étude par ablation sont disposibles dans le dossier Experimental results.
Le rapport du projet est quant à lui disponible dans le dossier Ressources.
Enfin, voici le lien de notre vidéo concernant la présentation de notre projet : https://drive.google.com/drive/folders/1FslJ9VmcYSbL8w7sjeQ0notSl8-W7cDv?usp=sharing
Si vous avez des questions, vous pouvez nous envoyer aux mails suivants :
Vincent Fu : vincent.fu@etu.sorbonne-universite.fr
Yuhao Liu : yu-hao.liu@etu.sorbonne-universite.fr