Skip to content

Conversation

@haribonyam
Copy link
Contributor

🧩 구현/변경 사항

  • 원본 JSON 파싱하여 필요한 데이터 가공
  • 가공된 데이터로 외부 API 호출 후 데이터 가공하여 중간 테이블 생성
  • 서비스코드로 카테고리 코드 - 명칭 테이블 생성
  • 카테고리 테이블과 중간 테이블 활용하여 마스터 테이블 생성 및 S3 저장

사용자 시나리오(UML)


🧪 테스트 결과

스크린샷 2025-11-26 오후 3 05 00

🪞 회고 및 개선 아이디어 (옵션)

  • 약 2000개의 관광지가 뽑혔는데 QA를 통해서 불필요한 관광지는 삭제하는 것이 좋겠습니다.
  • 추후에 청크단위 + 파이프라인 개선을 통해 완성도 있는 ETL 배치 파이프라인으로 리팩토링 하겠습니다..

GyuHwan and others added 4 commits November 26, 2025 14:58
- 원본을 필요한 속성만 dto 변환
- dto에서 필요없는 항목 필터링
- 카테고리 코드 : 네임 매칭을 위한 카테고리 테이블 초기화 작업
- 파싱된 데이터로 외부 API 호출 후 중간 테이블 생성
- 카테고리 코드번호 이름과 매칭하여 속성 생성
- 상세 주소로 서울시 + 00구 단위의 주소 생성
- 경도, 위도로 Geometry 정보(Points[x,y,ws4032]) 생성
- 마스터 테이블 저장 및 json 추출
- 마스터 테이블 json 파일 S3에 저장
- 중간 테이블 생성 코드 리팩토링
@haribonyam haribonyam self-assigned this Nov 26, 2025
@haribonyam haribonyam added the enhancement New feature or request label Nov 26, 2025
@haribonyam haribonyam linked an issue Nov 26, 2025 that may be closed by this pull request
4 tasks
Copy link
Contributor

@Bucoco Bucoco left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

차후에 리팩토링 하면서 청크단위로 배치처리 해서 api 호출을 줄이고 예외 코드별로 재시도 정책을 따로 설정하면 좋을 것 같아 보입니다. 고생하셨습니다!

@haribonyam haribonyam merged commit a13bb1f into develop Nov 26, 2025
4 checks passed
@BOKJUNSOO
Copy link

QA 무서워요

@haribonyam haribonyam linked an issue Dec 26, 2025 that may be closed by this pull request
2 tasks
@haribonyam haribonyam removed a link to an issue Dec 26, 2025
2 tasks
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

enhancement New feature or request

Projects

None yet

Development

Successfully merging this pull request may close these issues.

[BE-CORE] 마스터 테이블 etl 파이프라인

4 participants