Cian Scraper — это инструмент для сбора данных с сайта Cian с помощью веб-скрейпинга. Проект включает Telegram-бота, базу данных для хранения результатов, систему логирования и поддержку работы через прокси.
- 📡
requester.py— выполняет HTTP-запросы с поддержкой прокси. - 🏗️
parser.py— извлекает данные из HTML-страниц. - 🔍
scraper.py— основной класс для работы с Cian.
- 🎮
bot.py— основной файл для управления ботом. - 📝
handlers/— обработчики команд и событий. - 🎛️
keyboards/— интерфейсные элементы для пользователя.
Загружается из файла .env
- 🛠️
database.py— управление соединением с БД (PostgreSQL). - 📋
models.py— структуры данных. - 🔄
crud/— запросы к БД.
Логирует работу приложения.
git clone https://github.com/your-repo/cian-scraper.git
cd cian-scraperpip install -r requirements.txtСоздайте `` и добавьте:
DATABASE_URL=postgresql+asyncpg://user:password@localhost:5432/cian
LOGGER_MODE=console
TELEGRAM_API_KEY=your_telegram_api_key
TELEGRAM_ADMIN_ID=your_admin_id
PROXIES=http://proxy1:port,http://proxy2:portexport PYTHONPATH="$PWD"
python main.pypytest tests/docker pull neimes/cian_scraper:latestdocker-compose up --build -ddocker-compose down