Este projeto visa a construção de uma ferramenta capaz de extrair textos de imagens de forma eficiente.
- tesseract-ocr
- tesseract-ocr-por
- python3-opencv
- python3-numpy
- pillow
- opencv-python
- pytesseract
- sudo apt-get install tesseract-ocr
- sudo apt-get install tesseract-ocr-por
- sudo apt-get install python3-opencv
- sudo apt-get install python3-numpy
- pip3 install pillow
- pip3 install opencv-python
- pip3 install pytesseract
Você pode verificar o funcionamento da ferramenta executando o arquivo demo.py.
Ao executar esse arquivo, ele irá gerar arquivos no formato txt na pasta "demo-txt", com o nome correspondente a imagem que se encontra na pasta "demo-img"
OBSERVAÇÃO: Com quantos mais pixels a foto estiver, melhor será o resultado.