Skip to content

微调时遇到的问题 #19

@shouji000

Description

@shouji000

大佬您好:
拜读您的著作“lightvla”后,深感钦佩。便想着深入学习您的工作,在学习过程中,遇到了一些小问题。我在用您提供的指令进行训练时(如下)
torchrun
--standalone
--nnodes 1
--nproc-per-node 1
vla-scripts/finetune.py
--vla_path ./pretrained_checkpoint/openvla-7b
--data_root_dir ./libero
--dataset_name libero_spatial_no_noops
--run_root_dir ./pretrained_checkpoint/CXF-LightVLA-libero-spatial-20251222
--use_l1_regression True
--use_diffusion False
--use_film False
--num_images_in_input 2
--use_proprio True
--batch_size 8
--learning_rate 5e-4
--num_steps_before_decay 100000
--max_steps 150005
--save_freq 10000
--save_latest_checkpoint_only False
--image_aug True
--lora_rank 32
随后进行验证,指令如下
python experiments/robot/libero/run_libero_eval.py --pretrained_checkpoint ./pretrained_checkpoint/CXF-LightVLA-libero-10-20251218/openvla-7b+libero_10_no_noops+b8+lr-0.0005+lora-r32+dropout-0.0--image_aug2025-12-19\ 09:41:48.546572--30000_chkpt --task_suite_name libero_10 --save_rollout_video false
出现了下图所示的问题

Image

模型只留下了极少部分的token,成功率也很低,不知道这是啥问题导致的。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions