Skip to content

euandros/transcriptor

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Transcriptor

Segmento Fase Tecnologias Versão

Transcriptor é uma aplicação gráfica em Python que permite a transcrição offline de arquivos de áudio para texto utilizando o modelo de reconhecimento de fala Vosk. A aplicação suporta diversos formatos de áudio, como MP3, OGG, FLAC e WAV, e permite salvar a transcrição resultante em um arquivo de texto.

Índice

Recursos

  • Suporte a vários formatos de áudio: MP3, OGG, FLAC, WAV.
  • Transcrição offline utilizando o modelo Vosk.
  • Interface gráfica amigável e intuitiva construída com Tkinter.
  • Conversão automática de arquivos de áudio estéreo para mono, se necessário.
  • Barra de progresso para acompanhar o andamento da transcrição.
  • Mensagens de log para acompanhar o status do processo.
  • Salvamento da transcrição em um arquivo de texto.

Instalação

Pré-requisitos

  1. Python 3.7 ou superior deve estar instalado no sistema.

  2. Dependências Python: As dependências listadas na seção Dependências podem ser instaladas usando o pip.

  3. Modelo Vosk: Baixe o modelo de linguagem Vosk para português (ou outro idioma de sua escolha) e extraia o conteúdo para o diretório models dentro do projeto.

    mkdir -p models
    cd models
    wget https://alphacephei.com/vosk/models/vosk-model-small-pt-0.3.zip
    unzip vosk-model-small-pt-0.3.zip
    

Instalação

  1. Clone o Repositório:

    git clone https://github.com/euandros/transcriptor.git
    cd transcriptor
    
  2. Crie um abiente virtual:

     python3 -m venv venv
     source venv/bin/activate  # Linux/MacOS
     venv\Scripts\activate  # Windows
    
  3. Instale as dependências:

    pip install -r requirements.txt
    
  4. Atualize o caminho do modelo:

    model_path = "/caminho/para/vosk-model"  
    

Uso

  1. Executar a aplicação:

    python transcriptor.py
    

image

Na interface gráfica que será aberta:

Clique em "Procurar" para selecionar o arquivo de áudio que deseja transcrever.

image

Após a conclusão, você pode salvar a transcrição em um arquivo de texto clicando em "Salvar".

  1. Transcrever o áudio:

Clique em "Transcrever" para iniciar o processo de transcrição. A barra de progresso mostrará o andamento da transcrição.

image

Ao fim da transcrição, caso bem sucedida, uma mensagem será exibida na área de log da interface.

image

  1. Salvar a transcrição:

Clique em "Salvar" para armazenar o texto transcrito em um arquivo .txt.

image

Contribuição

Contribuições são bem-vindas! Se você quiser melhorar este projeto, sinta-se à vontade para abrir uma issue ou enviar um pull request.

Licença

Este projeto é licenciado sob a MIT License.

About

Transcriptor é uma aplicação gráfica em Python que permite a transcrição offline de arquivos de áudio para texto utilizando o modelo de reconhecimento de fala Vosk.

Resources

License

Stars

Watchers

Forks

Contributors

Languages