LoRA-ViT

Low-Rank Adaptation for Vision Transformers. Apply LoRA to any ViT with a single wrapper.

On Mac? Check out mlx-vit-tune — native MLX fine-tuning for ViT with LoRA and full FT, gradient checkpointing, and an Unsloth-like API. 2-5x faster than PyTorch CPU on the same chip.

Links

[Homepage] [arXiv] [MLX Version]

Features

LoRA for timm Vision Transformers
LoRA for lukemelas/PyTorch-Pretrained-ViT
DeepLab segmentation support
Multi-LoRA support
Save / load adapters via safetensors

Installation

git clone https://github.com/JamesQFreeman/LoRA-ViT.git
pip install torch timm safetensors

Requires torch>=1.10.0.

Usage

With timm

import timm
import torch
from lora import LoRA_ViT_timm

img = torch.randn(2, 3, 224, 224)
model = timm.create_model('vit_base_patch16_224', pretrained=True)
lora_vit = LoRA_ViT_timm(vit_model=model, r=4, alpha=4, num_classes=10)
pred = lora_vit(img)
print(pred.shape)

With PyTorch-Pretrained-ViT

from base_vit import ViT
import torch
from lora import LoRA_ViT

model = ViT('B_16_imagenet1k')
model.load_state_dict(torch.load('B_16_imagenet1k.pth'))

# 86M params → only 147K trainable with LoRA
lora_model = LoRA_ViT(model, r=4, alpha=4, num_classes=10)
num_params = sum(p.numel() for p in lora_model.parameters() if p.requires_grad)
print(f"trainable parameters: {num_params}")  # 147456

Segmentation (DeepLabV3)

model = ViT('B_16_imagenet1k')
model.load_state_dict(torch.load('B_16_imagenet1k.pth'))
lora_model = LoRA_ViT(model, r=4, alpha=4)
seg_lora_model = SegWrapForViT(vit_model=lora_model, image_size=384,
                               patches=16, dim=768, n_classes=10)

Save and Load

lora_model.save_lora_parameters('mytask.lora.safetensors')
lora_model.load_lora_parameters('mytask.lora.safetensors')

Citation

@misc{zhu2023melo,
      title={MeLo: Low-rank Adaptation is Better than Fine-tuning for Medical Image Diagnosis}, 
      author={Yitao Zhu and Zhenrong Shen and Zihao Zhao and Sheng Wang and Xin Wang and Xiangyu Zhao and Dinggang Shen and Qian Wang},
      year={2023},
      eprint={2311.08236},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Credit

ViT code and ImageNet pretrained weights from lukemelas/PyTorch-Pretrained-ViT.

Name		Name	Last commit message	Last commit date
Latest commit History 88 Commits
assets		assets
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
adapter.py		adapter.py
base_vit.py		base_vit.py
examples.ipynb		examples.ipynb
lora.py		lora.py
loss_landscape.ipynb		loss_landscape.ipynb
performance_profile.py		performance_profile.py
seg_vit.py		seg_vit.py
train.py		train.py
train_3D.py		train_3D.py
train_kfold.py		train_kfold.py
train_timm.py		train_timm.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LoRA-ViT

Links

Features

Installation

Usage

With timm

With PyTorch-Pretrained-ViT

Segmentation (DeepLabV3)

Save and Load

Citation

Credit

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

LoRA-ViT

Links

Features

Installation

Usage

With timm

With PyTorch-Pretrained-ViT

Segmentation (DeepLabV3)

Save and Load

Citation

Credit

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages