Это репозиторий для решений хакатона в рамках DataCon от SCAMT ITMO
Ключевая задача работы всех файлов: подготовка данных о наноматериалах к обучению модели МЛ для предсказания токсичности веществ
Первым файлом нужно запустить requirements.py
Он подгрузит все необходимые библиотеки
Далее идет файл united_db.py
Он чистит исходные таблицы и соединяет их в одну
Далее - general_db_cleaning.py
Этот файл готовит данные для работы с моделью
model.py - файл с кодом для модели RandomForestRegressor
svr_model.py - код для модели StackingRegressor на базе RandomForestRegressor и SVR
cat_model.py - код для модели CatBoostRegressor
Все файлы .xlsx, находящиеся в репозитории, загружены для удобства работы программ
Если произошла ошибка при загрузке базы данных, перезапустите код, могли возникнуть неполадки в интернет-соединении
В создании принимали участие:
Софья Сиротенко
djzhendogg
yuriiseregin1
HachimanCool
nikolAIchem