Парсер сообщений — это инструмент для извлечения и классификации текста из скриншотов диалогов. Он использует OCR (оптическое распознавание символов) для определения текста и классифицирует каждое сообщение как отправленное пользователем или партнером, исключая системные сообщения.
- Распознавание текста на изображениях.
- Классификация сообщений на основе их расположения.
- Исключение системных сообщений, расположенных в центре изображения.
- Python 3.8+
- OCR API Yandex Cloud
Установите все зависимости, используя requirements.txt:
pip install -r requirements.txt