Задача прогнозирования стоимости недвижимости (price) на основе её характеристик. Датасет содержит информацию о продажах жилой недвижимости в округе Кинг (King County, Washington, USA) за период 2014-2015 годов.
| Участник | Роль | Ноутбук |
|---|---|---|
| Стас | Постановка задачи и данные | 01_data_and_task_setup.ipynb |
| Стас | Базовые методы | 02_baseline_models.ipynb |
| Кирилл | Продвинутые методы кластеризации | 03_advanced_models.ipynb |
| Максим | Интерпретация и визуализация | 05_model_interpretation.ipynb |
| Роман | Анализ ошибок или результатов | 06_error_analysis.ipynb |
| Илья | Репродуцируемость | 07_reproducibility_check.ipynb |
notebooks/ — отдельный ноутбук под каждый этап
data/raw/ — исходные данные (diabetes.csv)
data/interim/ — промежуточные (например, diabetes_stage1.csv)
src/ — вспомогательные функции (опционально)
- Выбрал тип задачи: регрессия
- Описал датасет и задачу
- Реализовал baseline-метод (KMeans)
- Реализовал продвинутый метод (DBSCAN/Иерархическая)
- Посчитал метрики, сделал сравнение
- Добавил интерпретацию/визуализацию
- Провёл анализ ошибок или ограничений
- Зафиксировал seed, проверил воспроизводимость
- Объединить выводы всех участников в финальный отчет (PDF/DOCX)
- Подготовить презентацию с ключевыми находками
- Сохранить финальные модели для возможного использования