- Python 3.8+
- Google Chrome
- ChromeDriver
selenium
google-cloud-vision
openai
google-generativeai
PyMuPDF (fitz)
Pillow
tqdm
tiktoken- Google Cloud Vision API: Para OCR
- OpenAI API: Para modelos GPT
- Google Gemini API: Para modelos Gemini
- Clone o repositório:
git clone <repository-url>
cd "Nova pasta (2)"- Instale as dependências:
pip install -r requirements.txt- Configure o ChromeDriver:
- Baixe o ChromeDriver compatível com sua versão do Chrome
- Adicione ao PATH do sistema
Configure as seguintes variáveis de ambiente:
# OpenAI
export OPENAI="sua-chave-openai"
# Google Gemini
export GEMINI="sua-chave-gemini"Crie o arquivo cloud_ocr/key.json com suas credenciais do Google Cloud:
{
"type": "service_account",
"project_id": "seu-projeto",
"private_key_id": "...",
"private_key": "...",
"client_email": "...",
"client_id": "...",
"auth_uri": "https://accounts.google.com/o/oauth2/auth",
"token_uri": "https://oauth2.googleapis.com/token"
}Configure suas credenciais de acesso ao sistema e-Proc no código de automação.
from WorkFlow import Generate_Final_Report
# Gerar laudo usando GPT-4
Generate_Final_Report(
model="gpt-4o-2024-08-06",
system_instruction="prompt_personalizado",
reasoning_effort="medium"
)from run_one_at_time import run_processes_sequentially
# Processar todos os relatórios na pasta Reports/
run_processes_sequentially()from autofill import main
from selenium import webdriver
driver = webdriver.Chrome()
main(driver, "numero_do_processo")Para utilizar a interface em HTML com envio por drag and drop, execute:
python app.pyO navegador exibirá os relatórios gerados e permitirá visualizar o conteúdo em Markdown.
Módulo principal que coordena todo o fluxo de processamento:
- Reconhecimento OCR de documentos
- Geração de relatórios com IA
- Limpeza de arquivos temporários
Interface para modelos de IA:
- GPTReport: Geração usando modelos GPT
- GeminiReport: Geração usando Gemini
- O3Report: Suporte para modelos O3
- MiniTemplate: Organização de dados estruturados
Automação completa do sistema e-Proc:
- Login automático
- Navegação por processos
- Preenchimento de formulários
- Upload de documentos
Processamento OCR avançado:
- Extração de texto de PDFs
- Processamento por páginas
- Otimização de qualidade
Utilitários do sistema:
- Contagem de tokens
- Barras de progresso
- Cálculo de custos de API
# 1. Processar documento PDF
from cloud_ocr.cloud_ocr import VertexOCR
VertexOCR("documento.pdf", "output.txt")
# 2. Gerar template estruturado
from Models.models import MiniTemplate
template = MiniTemplate("gpt-4o-mini", "output.txt", None)
# 3. Gerar laudo final
from Models.models import GPTReport
GPTReport("output.txt", "gpt-4o-2024-08-06", system_instruction)
# 4. Automatizar preenchimento
from autofill import main
main(driver, "numero_processo")- Dados Sensíveis: Todos os documentos médicos são processados localmente
- APIs Seguras: Comunicação criptografada com serviços de IA
- Conformidade LGPD: Processamento responsável de dados pessoais
-
Erro de ChromeDriver:
- Verifique se o ChromeDriver está no PATH
- Confirme compatibilidade de versões
-
Erro de API:
- Verifique as chaves de API
- Confirme limites de uso
-
Erro de OCR:
- Verifique as credenciais do Google Cloud
- Confirme qualidade do PDF
- Interface gráfica (GUI)
- Suporte a mais formatos de documento
- Integração com outros sistemas judiciais
- Dashboard de métricas
- API REST
Contribuições são bem-vindas! Por favor:
- Faça um fork do projeto
- Crie uma branch para sua feature
- Commit suas mudanças
- Push para a branch
- Abra um Pull Request
Este projeto está sob licença MIT.
Para suporte técnico ou dúvidas:
- Abra uma issue no GitHub
- Consulte a documentação dos módulos
- Verifique os logs de erro