- Name : 유건욱
- E-mail: gunwook0307@yonsei.ac.kr
- github: https://github.com/YooGunWook
- 사용 가능 언어: Python, R, Node.JS
- 사용 가능 분석 툴: sklearn, pytorch
- 사용 가능 DBMS: MySQL, MongoDB
- 사용 경험 있는 개발 툴: Docker, Apache Spark, Hive
- 북경한국국제학교 졸업
- 연세대학교 응용통계학과 수료 (졸업예정)
- 응용통계학과 과대표 (2018.01 ~ 2018.11)
- 연세대학교 빅데이터 학회 YBIGTA 14기 (2019.01 ~ 2021.02)
- YBIGTA Design Team (2019.03~2019.12)
- YBIGTA 15기 학회장 (2019.07 ~ 2019.12)
- YBIGTA Engineering Team (2020.01 ~ 2021.02)
- (주)IMAS 데이터 분석팀(2019.10.26 ~ 2020.02.13)
- LOF를 활용한 자동 고장 진단
- Driving score(안전 운전 점수) 구현
- LSTM을 활용한 미션오일 온도 예측
- 차트로 알아보는 전기 자동차
- OBD 기기 업데이트 자동화 프로그램
- (주)네이버웹툰 ToonRadar Team(2020.06.29 ~ 2020.09.11)
- 불펌 사이트 탐지 모델 제작
- 실시간 모니터링 시스템 구축
- (주)데이터비 개발팀(2021.01.04 ~ 2021.07.03)
- 영어 문장 문법 오류 진단 모델 개발
- lexical substitution 모델 개발
- synonym 모듈 개발
- 영어 문장 문법 오류 위치 탐지 모델 개발
- 문장 추천 최적화 모델 개발
- SK브로드밴드 AI/DT Tech Team(2021.07.19 ~ 2021.08.27)
- VOD 추천 시스템 개발
Python Machine Learning 13위
안전한 원자력발전을 위해 한국수력원자력에서 제공한 모의 운전 및 실제 데이터를 기반으로 하는 AI 알고리즘 개발하는 대회
- LightGBM 모델을 사용해서 모델 개발
- 최종 13위 기록
Python Machine Learing
제주도 버스의 효율적인 운행을 위해 퇴근시간 승차인원을 예측하는 모델을 만드는 대회
- 제주도 관련 데이터 크롤링
- Boosting 모델을 기반으로 모델 개발
Python JavaScript Konlpy 시각화
시대별로 유행했던 노래의 가사를 당시 시대상과 연관지어 분석하고 시각화한 프로젝트
- 벅스에서 가사 크롤링
- 논문 리뷰를 통해 TF-IDF와 H-P point 구현
- JavaScript를 통해 웹으로 시각화 결과 시연
Python Deep Learning Pytorch KOBERT
주어진 글만 보고 쓴 사람의 성격을 예측하는 프로젝트
- 네이버 MBTI & Health 카페 크롤링
- Transformer 기반 Pretrained 모델인 KoBERT를 기반으로 개발
Python Machine Learning QGIS
서울시 공공데이터를 기반으로 자유주제로 분석하는 공모전
- 외부 데이터 크롤링
- 비지도 학습을 통해 최적의 입지 선정 (K-means Clustering)
Python QGIS Tableau R
대전시 데이터를 활용해서 자유주제로 분석하는 공모전
- 외부 데이터 크롤링
- Neural Network 기반 SOM을 통한 클러스터링
- QGIS, Tableau를 통한 시각화
Python R Machine Learning
음원 데이터를 활용한 음원순위 예측 프로젝트
- 음원차트 사이트 크롤링
- machine learning 모델을 통한 음원 순위 예측 (boosting model)
- 우수 프로젝트 선정
Python Machine Learning
STATIZ 데이터 기반으로 선수들의 능력만으로 연봉을 예측하는 프로젝트
- STATIZ 사이트 크롤링
- 데이터 EDA를 통한 인사이트 추출
- machine learning 모델을 통한 선수 연봉 예측
NodeJS JavaScript MySQL
데이터 크라우드 소싱 사이트 구축
- Node.JS 기반 벡엔드 개발
- 사이트 구축을 위한 디비 설계
Python Pytorch Transformer NLP
수학 문제에 대한 데이터가 주어질 때 문제의 유형을 예측하는 프로젝트
- Transformer 기반 딥러닝 모델 활용 (BERT, Electra)
- 수학 기호에 따른 전처리 모듈 개발
Python algorithm
프로그래머스에 있는 문제들을 기반으로 코딩 테스트 대비 및 알고리즘 공부한 내용 정리
Python 자료구조 algorithm
파이썬 자료구조와 알고리즘: 기초 튼튼, 핵심 쏙쏙, 실력 쑥쑥 자료구조와 알고리즘 이론에 대해 학습 및 정리
- 자료구조 공부
- 알고리즘 이론 공부
Pyspark 분산처리 YBIGTA 스파크 완벽 가이드
스파크 완벽 가이드 스파크 이론과 실습에 대해 학습 및 정리
- Pyspark
- 구조적 API
- RDD
MySQL MongoDB
생활코딩 DataBase - MySQL과 SQL 첫걸음, 그리고 MongoDB in Action 에서 공부한 내용 정리
- MySQL
- MongoDB
현재까지 수강한 과목 리스트입니다.
- 통계학입문
- 선형대수
- 통계방법론
- 컴퓨터자료처리
- 회귀분석
- 시계열분석
- 금융리스크관리실무와통계학
- 수리통계학(1)
- 수리통계학(2)
- AI비즈니스
- 데이터사이언스표본추출이론
- 데이터사이언스를위한확률과정
- 데이터마이닝
- 데이터사이언스(2):네트워크분석
- 데이터사이언스입문
- 딥러닝
- 인사빅데이터분석법
- 데이터베이스시스템
- 데이터사이언스(1):데이터통합과정보보호
- 데이터베이스
- 다변량통계분석
- 보험통계