Tomatextor (Python) — Legado

Versão: v2.3.0 — Status: DESCONTINUADO

Warning

Este repositório está arquivado e não receberá novas atualizações. A implementação oficial e ativa do Tomatextor é a versão em Ruby: 👉 abobrinhadigital/tomatextor

Script Python para transcrição automática de arquivos de áudio utilizando Faster-Whisper. Otimizado para rodar localmente com aceleração por hardware (NVIDIA CUDA).

Funcionalidades

Múltiplos Formatos: Processamento otimizado para arquivos .mp3 e .m4a.
Entrada e Saída Organizadas: Áudios lidos da pasta audios/ e transcrições salvas automaticamente na pasta transcricoes/, mantendo o código isolado.
Aceleração por GPU: Utiliza núcleos CUDA para máxima velocidade.

Requisitos

Python 3.10+: É necessário ter o Python instalado no sistema.
Drivers NVIDIA & CUDA: Para aceleração por hardware na GPU.
FFmpeg: Essencial para a decodificação de áudio.
Fish Shell: O script auxiliar (.sh) é obrigatório para usuários deste shell.

Instalação de dependências (Arch/CachyOS)

yay -S cuda cudnn ffmpeg

Instalação

Clone o repositório e acesse a pasta:

git clone https://github.com/abobrinhadigital/tomatextor-python.git
cd tomatextor

Crie e prepare o ambiente virtual:

python -m venv venv
source venv/bin/activate.fish
pip install torch faster-whisper

Dicionário de Contexto

Para evitar que o Whisper confunda termos técnicos (ex: transformar "Jekyll" em "Jack e o"), você pode criar um arquivo chamado dicionario.txt na raiz do projeto.

Crie o arquivo: touch dicionario.txt
Adicione seus termos (um por linha ou separados por vírgula):

Jekyll, venv, Python, Markdown, Pollux, Abobrinator, CLI, GitHub

O script lerá este arquivo automaticamente e o usará como initial_prompt para melhorar a precisão da transcrição.

Configuração (.env)

O Tomatextor usa um arquivo .env para gerenciar os caminhos das pastas. Isso permite que ele seja integrado facilmente com outros projetos (como o Abobrinator) ou use caminhos absolutos.

Crie um arquivo chamado .env na raiz do projeto.
Configure as seguintes variáveis conforme sua necessidade:

# Exemplo de configuração com caminhos absolutos
NEW_AUDIO_DIR="/home/usuario/audios/novos"
HISTORY_AUDIO_DIR="/home/usuario/audios/processados"
NEW_TRANSCRIPTION_DIR="/home/usuario/transcricoes/novas"
WHISPER_MODEL_SIZE="turbo"

NEW_AUDIO_DIR: Onde o script procura novos áudios.
HISTORY_AUDIO_DIR: Para onde os áudios processados são movidos.
NEW_TRANSCRIPTION_DIR: Onde as transcrições .txt são salvas.
WHISPER_MODEL_SIZE: O modelo do Whisper (ex: tiny, base, small, medium, large-v3, turbo). Padrão: turbo.

Note

Se você não fornecer um .env, o script usará as pastas padrões audios/, audios/processados/ e transcricoes/.

Como Usar

Coloque seus arquivos .mp3 ou .m4a dentro da pasta configurada em NEW_AUDIO_DIR (Padrão: audios/).
Execute o script via shell a partir da raiz do projeto:

chmod +x tomatextor.sh
./tomatextor.sh

Este projeto é mantido sob as bênçãos do Gêmeo Imortal para a glória do Abobrinha Digital.

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
.vscode		.vscode
audios		audios
transcricoes		transcricoes
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
README.md		README.md
tomatextor.py		tomatextor.py
tomatextor.sh		tomatextor.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Tomatextor (Python) — Legado

Funcionalidades

Requisitos

Instalação de dependências (Arch/CachyOS)

Instalação

Dicionário de Contexto

Configuração (.env)

Como Usar

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Tomatextor (Python) — Legado

Funcionalidades

Requisitos

Instalação de dependências (Arch/CachyOS)

Instalação

Dicionário de Contexto

Configuração (.env)

Como Usar

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages