- flowchart 구상 와중 우리의 주 기능이라고 생각되는 정보 크롤링 수행
github에서 자신을 소개하는 공간이락 생각되는 readme 를 주 타겟으로 잡음
수행업무
- readme 에서 text로 되어있느 정보 수집 로직 구현
예정사항
- 자신의 프로필 (ex. 대학교 , 사는 곳등으 적는 공간도 추가적으로 크롤링 할 계획)
velog 는 개발자 블로그로써 텍스트 내용이 무수히 많다 . 즉 , 선별을 해야 할 필요성을 느꼈으며 그 중 , tag 목록에 나와있는 title 과 series에 지정해놓은 title이렇게 두개를 타겟으로 잡았다.
수행업무
- tag title과 , series title 정보 수집 로직 구현
예정사항
- velog 특징일 수 있느 같은 header 정보를 이용하여 요청할 경우 , 몇번 수행 후 차단하는 것 같은 행동이 보여 , 이 부분을 보완해야 할 듯 함.
- flowchart 구상 와중 우리의 주 기능이라고 생각되는 정보 크롤링 수행
tistory 에서 MAIN화면에 띄워져 있는 최근 게시물 제목을 수집하는 것으로 잡고 수행 수행업무
- main화면에서의 제목 수집 완료
예정사항
- tistory특성상 사용자가 블로그 스킨을 꾸밀 수 있어 , 개개인마다 태그가 다르다는 것이 이슈로 작용
- 이 부분 보완을 위해 , 상의가