QuantDisBrain

Code for Quantization and Disentanglement for Cross-Modal Alignment in Neural Speech Reconstruction from Brain Activity

1 Download

1.1 Datasets

Gwilliams et al. Dataset https://osf.io/ag3kj

Armeni et al. Dataset https://data.ru.nl/collections/di/dccn/DSC_3011085.05_995

GigaSpeech Dataset (XS) https://github.com/SpeechColab/GigaSpeech

1.2 Checkpoints

download ns3_facodec_encoder.bin and ns3_facodec_decoder.bin from FACodec

download pretrained.pth from AudioMAE

download audioldm2-speech-gigaspeech.pth from AudioLDM2

2 Environment

Follow the steps below to set up the virtual environment.

Create and activate the environment:

conda create -n QDBrain python=3.10
conda activate QDBrain

Install dependencies in the listed order:

pip install -r requirements.txt

3 Training

3.1 Stage 1

CUDA_VISIBLE_DEVICES=1 python train_proj.py

3.2 Stage 2

CUDA_VISIBLE_DEVICES=1 python train_disentangle.py

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
amphion_evaluation		amphion_evaluation
amphion_utils		amphion_utils
audioldm2		audioldm2
ns3_facodec		ns3_facodec
README.md		README.md
brain_module.py		brain_module.py
calc_metrics.py		calc_metrics.py
codebook_clustering.py		codebook_clustering.py
dataset.py		dataset.py
inference.py		inference.py
projector.py		projector.py
requirements.txt		requirements.txt
train_disentangle.py		train_disentangle.py
train_proj.py		train_proj.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

QuantDisBrain

1 Download

1.1 Datasets

1.2 Checkpoints

2 Environment

3 Training

3.1 Stage 1

3.2 Stage 2

Reference

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

QuantDisBrain

1 Download

1.1 Datasets

1.2 Checkpoints

2 Environment

3 Training

3.1 Stage 1

3.2 Stage 2

Reference

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages