Reimplementação do paper "Rememberer: Large Language Models Are Semi-Parametric Reinforcement Learning Agents"

Projeto_RL.pdf: Relatório com modelagem matemática segundo framework proposto por Warren B. Powell em "Sequential Decision Analytics and Modeling: Modeling with Python" (https://castle.princeton.edu/wp-content/uploads/2022/03/Powell-Sequential_Decision_Analytics_NOW_March4-2022-1.pdf)
llm_pomdp.ipynb: Versão do paper reimplementada de acordo com a biblioteca pomdp_py
projeto_in1087: Slides
rememberer.ipynb: Notebook para reprodução da versão original do artigo. Contém instruções para execução do próprio notebook (é necessário fazer alguns ajustes na implementação original).

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
webshop		webshop
Projeto___RL.pdf		Projeto___RL.pdf
README.md		README.md
llm_pomdp.ipynb		llm_pomdp.ipynb
projeto_in1087.pdf		projeto_in1087.pdf
rememberer.ipynb		rememberer.ipynb

Provide feedback