请问,tokenizer的训练用了多少训练数据, 以及和whisper 对齐的数据用了多少呢?
请问,tokenizer的训练用了多少训练数据, 以及和whisper 对齐的数据用了多少呢?