๋ฐ์ดํฐ๋ฅผ ํตํด ์ฌ์ฉ์์ ์จ๊ฒจ์ง ๋์ฆ๋ฅผ ๋ฐ๊ฒฌํ๊ณ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ์์ฌ๊ฒฐ์ ์ ๋์์ ์ฃผ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค. Python, SQL, ๋จธ์ ๋ฌ๋, ๋ฅ๋ฌ๋ ๊ธฐ์ ์ ํ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ณ ์ธ์ฌ์ดํธ ๋ฐ๊ตด์ ๊ธฐ์ฌํ๊ณ ์ ํฉ๋๋ค. ๋ค์ํ ํ๋ก์ ํธ ๊ฒฝํ์ ํตํด ๋ฐ์ดํฐ ๋ถ์์ ํ์ํ ์ค๋ฌด ์ญ๋์ ํค์ฐ๊ณ ์์ผ๋ฉฐ ์์ผ๋ก๋ ๋์์์ด ๋ฐฐ์ฐ๊ณ ์ฑ์ฅํ์ฌ ์ฌ์ฉ์์๊ฒ ์ต๊ณ ์ ๊ฐ์น๋ฅผ ์ ๊ณตํ๋ ๊ฐ๋ฐ์๊ฐ ๋๊ฒ ์ต๋๋ค.
- ํ์๋ํ๊ต(4.16/4.5) ๋ฌด์ธํญ๊ณต๊ธฐํ๊ณผ(์ฃผ์ ๊ณต)/ํญ๊ณต์ํํธ์จ์ด๊ณตํ๊ณผ(๋ณต์์ ๊ณต)
- KT AIVLE-EDU(Data Analysis & AI, 2024.09 ~ 2025.02)
- ๋ฉ์์ด์ฌ์์ฒ๋ผ(Django - ๋ฐฑ์๋ ๊ฐ๋ฐ, 2022.04 ~ 2022.12)
- AICE Associate - 2025.02
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ - 2024.09
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ(ADsP) - 2024.09
- SQL๊ฐ๋ฐ์(SQLD) - 2024.09
- ์ด๊ฒฝ๋๋นํ์ฅ์น ์กฐ์ข ์ 1์ข - 2019.04
์คํ๊ตฐ(variant)๊ณผ ๋์กฐ๊ตฐ(control) ๊ฐ์ ์ฌ์ฉ์ ์์ต(REVENUE)์ ์ฐจ์ด๊ฐ ์๋์ง๋ฅผ ํ๊ฐํ๊ธฐ ์ํ A/B ํ ์คํธ ์คํ ๊ฒฐ๊ณผ๋ฅผ ๋ถ์
- Data: Kaggle A/B test data
- ๋ชฉํ: variant๊ฐ control๋ณด๋ค ์์ต์ฑ์ด ๋์์ง ํ์ธ
- ๊ฐ์ค: ๊ท๋ฌด๊ฐ์ค(H0): Control์ ์์ต == Variant์ ์์ต / ๋๋ฆฝ๊ฐ์ค(H1): Variant์ ์์ต > Control์ ์์ต
- ๊ธฐ์ : EDA, ์ค๋ณต ์ ๊ฑฐ, MannโWhitney U ๊ฒ์
- ๊ฒฐ๊ณผ: ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด์ง ์์ / p-value > 0.05 โ ๊ท๋ฌด๊ฐ์ค ๊ธฐ๊ฐ ๋ถ๊ฐ / ์์ต์ ์ฐจ์ด๋ ํต๊ณ์ ์ผ๋ก ์ ์ํ์ง ์์
- Go to Repository
๊ธฐ์กด ํ์ด์ง์ ์๋ก์ด ๋๋ฉ ํ์ด์ง ๊ฐ ์ ํ์จ ๋น๊ต๋ฅผ ์ํ ๋ฐ์ดํฐ ๋ถ์
- Data: Kaggle A/B testing
- ๋ชฉํ: new_page๊ฐ old_page๋ณด๋ค ์ ํ์จ์ด ๋์์ง ํ์ธ
- ๊ฐ์ค: H0: new_page == old_page / H1: new_page > old_page
- ๊ธฐ์ : EDA, ๊ทธ๋ฃน/ํ์ด์ง ๋ถ์ผ์น ์ ๊ฑฐ, ์ค๋ณต ์ ๊ฑฐ, ์นด์ด์ ๊ณฑ ๊ฒ์
- ๊ฒฐ๊ณผ: p-value > 0.05 โ ๊ท๋ฌด๊ฐ์ค ๊ธฐ๊ฐ ๋ถ๊ฐ / ์ ํ์จ ์ฐจ์ด๋ ํต๊ณ์ ์ผ๋ก ์ ์ํ์ง ์์
- Go to Repository
Dacon "์ฑ๋ฌด ๋ถ์ดํ ์ฌ๋ถ ์์ธก" ํด์ปคํค์์ ์งํ๋์์ต๋๋ค. ๊ธ์ต ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ๊ณ ๊ฐ์ ์ฑ๋ฌด ๋ถ์ดํ ์ฌ๋ถ(0 ๋๋ 1)๋ฅผ ์์ธกํ๋ ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ฒ์ด ๋ชฉํ
- Data: ๊ธ์ต ๋ฐ์ดํฐ (๋์ถ ๋ชฉ์ , ์ง์ฅ ๊ทผ์ ์ฐ์ ๋ฑ)
- ๊ธฐ์ : ๋ฐ์ดํฐ ์ค์ผ์ผ๋ง(StandardScaler), ๋ณ์ ์ค์๋ ๋ถ์, CatBoost ์ต์ ํ(Bayesian Search), ๋จ์ธต ์ ๊ฒฝ๋ง(MLP) ์คํ
- ๊ฒฐ๊ณผ: ๋ฐ์ด์ฝ ํด์ปคํค 27์ / 1040๋ช ์ค, AUC ์ต๊ณ ์ฑ๋ฅ 0.638, '๋์ถ ๋ชฉ์ ' ๋ณ์ ์ ๊ฑฐ ์ ์ฑ๋ฅ ํฅ์
- Go to Repository
์บ๊ธ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด ์ ๋ ฅํ ์ ๋๋ฉ์ด์ ๊ณผ ์ ์ฌํ ์ ๋๋ฉ์ด์ ์ ์ถ์ฒํ๋ ๋ชจ๋ธ ๊ฐ๋ฐ.
- Data: ์ ๋๋ฉ์ด์ ์ ๋ณด, ์ฌ์ฉ์ ํ์ ๋ฐ์ดํฐ
- ๊ธฐ์ : ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(-1 ์ ๊ฑฐ, ๊ฒฐ์ธก๊ฐ ์ฒ๋ฆฌ), ํ์ ํํฐ๋ง ์ถ์ฒ, SVD ๋ชจ๋ธ
- ๊ฒฐ๊ณผ: ์ฌ์ฉ์ ์ ๋ ฅ ๊ธฐ๋ฐ ์ถ์ฒ ๊ฒฐ๊ณผ ์ ๊ณต, ์ถํ Full Matrix ๊ตฌ์กฐ ๋ฉ๋ชจ๋ฆฌ ๋ฌธ์ ํด๊ฒฐ ๋ฐฉ์ ๋ชจ์
- Go to Repository
- Data: ๊ตญํ ๊ตํต๋ถ ๋ฐ SGIS ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์ ๊ท ์ํํธ ๋จ์ง ์ฃผ์ฐจ ์์ ์์ธก
- ๊ธฐ์ : KNN, ํ๊ท, DecisionTree, RandomForest, LGB, XGB(GridSearch ์ต์ ํ)
- ๊ฒฐ๊ณผ: ์ ์ ์ฃผ์ฐจ๊ณต๊ฐ ์์ธก ๋ฐ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๋์ ๊ณํ ๊ฐ๋ฅ์ฑ ํ๊ตฌ
- Go to Repository
์์ธ์ ๋์ค๊ตํต ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ์ฌ ์ ๊ท ๋ฒ์ค ์ ๋ฅ์ฅ ์์น๋ฅผ ์ ์
- Data: ๋ฒ์ค ์นํ์ฐจ ์ ๋ณด, ์ ๋์ธ๊ตฌ, ์ฃผ๋ฏผ๋ฑ๋ก, ์ ์ข ๋ฐ์ดํฐ
- ๊ธฐ์ : ๋ณ์ ๋ถ์, ๊ฐ์ค ๊ฒ์ฆ, ์ต์ ์ ๋ฅ์ฅ ์์น ์ ์
- ๊ฒฐ๊ณผ: ์ ๊ท ์ ๋ฅ์ฅ ์์น ์ ์ ๋ฐ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์์ฌ๊ฒฐ์
- Go to Repository
๊ธฐ์ ์ ์ฑ์ฉ ํ๋ก์ธ์ค๋ฅผ ํจ์จ์ ์ผ๋ก ๊ฐ์ ํ์ฌ ์ ๋ฌด ๋ถ๋ด์ ์ค์ด๊ณ ๊ฐ๊ด์ ์ธ ์ง์์ ํ๊ฐ๋ฅผ ์ ๊ณต
- ์๋ํ๋ ํ๊ฐ: LangChain๊ณผ LangGraph๋ฅผ ํ์ฉํ ์ด๋ ฅ์ ๋ถ์ ๋ฐ ํ๊ฐ ์ ์ ์ ๊ณต
- ๋ง์ถคํ ๋ฉด์ ์ง๋ฌธ ์์ฑ: RAG ๊ธฐ๋ฒ์ ์ ์ฉํ ๊ฒฝํ ์ค์ฌ, ๊ฒฝ๋ ฅ ์ค์ฌ, ๊ธฐ์ ์ค์ฌ ์ง๋ฌธ ์์ฑ
- LangChain: PDF ์ด๋ ฅ์ ๋ฐ ์๊ธฐ์๊ฐ์์์ ํต์ฌ ์ ๋ณด ์๋ ์ถ์ถ ๋ฐ ์๋ฒ ๋ฉ
- LangGraph: ๊ธฐ์ ์ ํ๊ฐ ๊ธฐ์ค๊ณผ ๊ณผ๊ฑฐ ๋ฐ์ดํฐ ๋ฐ์ํ ์ง์์ ์ญ๋ ๋ถ์
- RAG ๊ธฐ๋ฒ: ์ ๋ํ๋ ์ ์ํ ๋ฐ ๋ง์ถคํ ์ง๋ฌธ ์์ฑ
- Go to Repository