RL from Bagged Reward

This repository contains the Jax implementation of RL from Bagged Reward.

Docker

cd docker
docker build -t docker . -f Dockerfile

Tips

# If you have problems with Cython, you can try:
pip uninstall Cython
pip install Cython==3.0.0a10

Example

Proposed Method

# Fixed-length reward bags
CUDA_VISIBLE_DEVICES=${device_num} python -m examples.train_reward_model --env_name=${env_name} --save_dir=./tmp_result/ --bag_len=${bag_len} --seed=${seed}

# Aarbitrary reward bags
CUDA_VISIBLE_DEVICES=${device_num} python -m examples.train_arbitrary_reward_model --env_name=${env_name} --save_dir=./tmp_result_arbitrary/ --seed=${seed}"

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
BaggedRewardModel		BaggedRewardModel
docker		docker
examples		examples
flaxmodels		flaxmodels
jaxrl		jaxrl
README.md		README.md
main		main

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RL from Bagged Reward

Docker

Tips

Example

Proposed Method

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

RL from Bagged Reward

Docker

Tips

Example

Proposed Method

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages