LLM-Explore

Project of NLP in PKU

.
├── categories.py # you can ignore it
├── evaluate-logits.py # 2.2.2 caculate percent of over-refuse and refuse
├── evaluate.py # 2.2.1 caculate percent of over-refuse and refuse
├── explore.py # 2.1, directly test on MMLU
├── refuse-logits.py # 2.2.2, let LLM say "I don't know"
└── refuse.py # 2.2.1, let LLM say "I don't know"

data

Data

2.2.1

python refuse.py -m <model-path>  
  
- `--ntrain`, `-k`: Number of training examples to use. Default is `5`.  
- `--data_dir`, `-d`: Directory containing the data. Default is `"data"`.  
- `--save_dir`, `-s`: Directory to save the results. Default is `"refuse-results"`.  
- `--model`, `-m`: Path to the model. Default is `"model\hub\LLM-Research\Llama-3___2-1B"`.

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
R-Tuning-data		R-Tuning-data
evaluation		evaluation
figures		figures
prompt-refuse-results		prompt-refuse-results
refuse-logits-results		refuse-logits-results
refuse-results		refuse-results
report		report
results		results
training		training
.gitignore		.gitignore
README-R-Tuning.md		README-R-Tuning.md
README.md		README.md
categories.py		categories.py
evaluate-logits.py		evaluate-logits.py
evaluate.py		evaluate.py
explore.py		explore.py
refuse-logits.py		refuse-logits.py
refuse.py		refuse.py
requirements.txt		requirements.txt
result.json		result.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLM-Explore

data

2.2.1

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

Halifuda/LLM-Explore

Folders and files

Latest commit

History

Repository files navigation

LLM-Explore

data

2.2.1

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages