Skip to content

monilouise/IN1087

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Reimplementação do paper "Rememberer: Large Language Models Are Semi-Parametric Reinforcement Learning Agents"

  • Projeto_RL.pdf: Relatório com modelagem matemática segundo framework proposto por Warren B. Powell em "Sequential Decision Analytics and Modeling: Modeling with Python" (https://castle.princeton.edu/wp-content/uploads/2022/03/Powell-Sequential_Decision_Analytics_NOW_March4-2022-1.pdf)
  • llm_pomdp.ipynb: Versão do paper reimplementada de acordo com a biblioteca pomdp_py
  • projeto_in1087: Slides
  • rememberer.ipynb: Notebook para reprodução da versão original do artigo. Contém instruções para execução do próprio notebook (é necessário fazer alguns ajustes na implementação original).

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors