Reimplementação do paper "Rememberer: Large Language Models Are Semi-Parametric Reinforcement Learning Agents"
- Projeto_RL.pdf: Relatório com modelagem matemática segundo framework proposto por Warren B. Powell em "Sequential Decision Analytics and Modeling: Modeling with Python" (https://castle.princeton.edu/wp-content/uploads/2022/03/Powell-Sequential_Decision_Analytics_NOW_March4-2022-1.pdf)
- llm_pomdp.ipynb: Versão do paper reimplementada de acordo com a biblioteca pomdp_py
- projeto_in1087: Slides
- rememberer.ipynb: Notebook para reprodução da versão original do artigo. Contém instruções para execução do próprio notebook (é necessário fazer alguns ajustes na implementação original).