Skip to content

weafo/contest_itmo

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

contest_itmo

scrape_plan_files.py — автоматическое скачивание учебных планов (PDF/XLSX) с сайта ИТМО с помощью playwright.Открывает страницы магистерских программ, находит кнопку «Скачать учебный план», загружает файл и сохраняет его локально в data/.Результаты (название программы, URL и путь к файлу) записываются в data/plan_files.json.

courses_parse.py — парсер учебных планов из data/plan_files.json. Извлекает из PDF/XLSX файлы названия дисциплин, семестр, тип («Обязательная»/«Выборная»), количество зачетных единиц (ECTS) и часов. Сохраняет итоговый список курсов в data/courses.json.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages