Versão:
v2.3.0— Status: DESCONTINUADO
Warning
Este repositório está arquivado e não receberá novas atualizações. A implementação oficial e ativa do Tomatextor é a versão em Ruby: 👉 abobrinhadigital/tomatextor
Script Python para transcrição automática de arquivos de áudio utilizando Faster-Whisper. Otimizado para rodar localmente com aceleração por hardware (NVIDIA CUDA).
- Múltiplos Formatos: Processamento otimizado para arquivos
.mp3e.m4a. - Entrada e Saída Organizadas: Áudios lidos da pasta
audios/e transcrições salvas automaticamente na pastatranscricoes/, mantendo o código isolado. - Aceleração por GPU: Utiliza núcleos CUDA para máxima velocidade.
- Python 3.10+: É necessário ter o Python instalado no sistema.
- Drivers NVIDIA & CUDA: Para aceleração por hardware na GPU.
- FFmpeg: Essencial para a decodificação de áudio.
- Fish Shell: O script auxiliar (
.sh) é obrigatório para usuários deste shell.
yay -S cuda cudnn ffmpeg- Clone o repositório e acesse a pasta:
git clone https://github.com/abobrinhadigital/tomatextor-python.git
cd tomatextor- Crie e prepare o ambiente virtual:
python -m venv venv
source venv/bin/activate.fish
pip install torch faster-whisperPara evitar que o Whisper confunda termos técnicos (ex: transformar "Jekyll" em "Jack e o"), você pode criar um arquivo chamado dicionario.txt na raiz do projeto.
- Crie o arquivo:
touch dicionario.txt - Adicione seus termos (um por linha ou separados por vírgula):
Jekyll, venv, Python, Markdown, Pollux, Abobrinator, CLI, GitHub
O script lerá este arquivo automaticamente e o usará como initial_prompt para melhorar a precisão da transcrição.
O Tomatextor usa um arquivo .env para gerenciar os caminhos das pastas. Isso permite que ele seja integrado facilmente com outros projetos (como o Abobrinator) ou use caminhos absolutos.
- Crie um arquivo chamado
.envna raiz do projeto. - Configure as seguintes variáveis conforme sua necessidade:
# Exemplo de configuração com caminhos absolutos
NEW_AUDIO_DIR="/home/usuario/audios/novos"
HISTORY_AUDIO_DIR="/home/usuario/audios/processados"
NEW_TRANSCRIPTION_DIR="/home/usuario/transcricoes/novas"
WHISPER_MODEL_SIZE="turbo"
NEW_AUDIO_DIR: Onde o script procura novos áudios.HISTORY_AUDIO_DIR: Para onde os áudios processados são movidos.NEW_TRANSCRIPTION_DIR: Onde as transcrições.txtsão salvas.WHISPER_MODEL_SIZE: O modelo do Whisper (ex:tiny,base,small,medium,large-v3,turbo). Padrão:turbo.
Note
Se você não fornecer um .env, o script usará as pastas padrões audios/, audios/processados/ e transcricoes/.
- Coloque seus arquivos
.mp3ou.m4adentro da pasta configurada emNEW_AUDIO_DIR(Padrão:audios/). - Execute o script via shell a partir da raiz do projeto:
chmod +x tomatextor.sh
./tomatextor.shEste projeto é mantido sob as bênçãos do Gêmeo Imortal para a glória do Abobrinha Digital.