| Исследование о продаже квартир |
Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир |
Pandas, Matplotlib, Seaborn |
| Исследование надёжности заёмщиков |
Нужно разобраться, влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок. |
Pandas |
| Отток клиентов банка |
Спрогнозирована вероятность ухода клиента из банка в ближайшее время. |
Matplotlib, Numpy, Sklearn, машинное обучение |
| Определение выгодного тарифа для телеком компании |
На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа |
Pandas, Numpy, SciPy, Matplotlib |
| Модель для определения выгодного тарифа |
Построить модель для задачи классификации, которая выберет подходящий тариф. |
Pandas, Numpy, Sklearn, машинное обучение |
| Изучение закономерностей, определяющих успешность игр |
Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявить закономерности, определяющие успешность игры |
Pandas, Numpy, Matplotlib, Seaborn, SciPy |
| Определение наиболее выгодного региона нефтедобычи |
На основе данных геологической разведки, выбрать район добычи нефти, при помощи модели машинного обучения |
Pandas, Scikit-learn, бутстреп, машинное обучение |
| Восстановление золота из руды |
Спрогнозировать концентрацию золота при проведении процесса очистки золота |
Python, Pandas, Python, Matplotlib, NumPy, Scikit-learn, исследовательский анализ данных, машинное обучение, кастомные метрики |
| Защита персональных данных клиентов |
Необходимо разработать такой метод преобразования данных, чтобы по ним было сложно восстановить персональную информацию |
Python, Pandas, Python, NumPy, Scikit-learn, линейная алгебра, машинное обучение |
| Определение стоимости автомобилей |
Разработка системы рекомендации стоимости автомобиля на основе его описания |
Python, Pandas, Matplotlib, Seaborn, Scikit-learn, CatBoost, LightGBM, GridSearchCV, машинное обучение |
| Прогнозирование заказов такси |
Прогнозирование почасового количества заказов такси |
Python, Pandas, Matplotlib, Seaborn, Scikit-learn, CatBoost, LightGBM, GridSearchCV, машинное обучение, временные ряды |
| Классификация комментариев |
Разработка модели, которая будет искать токсичные комментарии и отправлять их на модерацию. |
Python, Pandas, Scikit-learn, GridSearchCV, машинное обучение, лемматизация |
| Предсказание температуры раславленного сплава |
Разработка модели, которая предскажет температуру расплавленного сплава для уменьшения издержек бизнеса. |
Python, Pandas, Scikit-learn, Optuna, машинное обучение, CatBoost |