온라인 커뮤니티에서 건전한 소통을 위한 비속어 필터링과 긍정적, 부정적 댓글을 보다 편리하게 분류하기 위한 감정 분석 기능이 있는 웹 게시판입니다.
김수아 백엔드 |
김수연 모델 |
정모은 데이터분석 |
지민철 데이터엔지니어(팀장) |
오유빈 데이터엔지니어 |
최재웅 데이터분석 |
[문제현상]
온라인 커뮤니티에서 욕설 등 건전한 소통이 잘 되고 있지 않은 것 같다고 판단하였다.
[솔루션]
사용자들이 보다 책임간 있는 방식으로 소통할 수 있도록 유도하고 긍정적이고 건전한 커뮤니티 문화 조성하여 온라인 커뮤니티에서의 건전한 소통을 촉진합니다. 관리자가 커뮤니티 관리하는 시간과 노력을 절감하도록 합니다.
- 비속어 필터링 요구사항
- 비속어 사전은 관리자가 업데이트 가능해야 함
- 실시간으로 텍스트 검사가 이루어져야 함
- 비속어가 포함된 게시글 및 댓글은 게시 전에 사용자에게 경고 메시지 표시
- 감정 분석 요구사항
- 텍스트 감정 분석을 위해 NLP 기술 사용
- 분석 결과는 긍정, 부정, 중립으로 분류
- 분석 결과를 사용자와 관리자에게 시각적으로 표시
-
1일차
- 비속어 데이터 크롤링
- 일반 댓글 카테고리화 하여 크롤링
- AWS환경 구축
- Django로 백엔드 작업 시작
- 비속어 모델 설계 시작
- 감정분석 모델 설계 시작
-
2일차
- hadoop에 데이터 적재
- 학습을 위한 데이터 전처리(pandas, pyspark)
- 모델 학습 시작
-
3일차
- 비속어 모델 성능 미달로 다른 방법으로 대체
- 감정 분석 학습 데이터 늘려서 재학습
- 비속어를 리스트화 해서 웹에 적용시도
-
4일차
- 감정분석 모델 pth로 저장하여서 웹에 적용
- 비속어 필터 웹에 적용
- 회원가입 및 로그인
- 이메일 인증을 통한 사용자 가입
- 비밀번호 암호화 저장
- 게시판 기능
- 게시글 작성, 조회, 수정, 삭제
- 댓글 작성, 조회, 수정, 삭제
- 카테고리별 게시글 분류
- 비속어 필터링
- 게시글 및 댓글 작성 시 비속어 사전을 통한 필터링
- 검출된 비속어는 자동으로 가려짐 또는 경고 메시지와 함께 게시 거부
- 감정 분석
- 게시글 및 댓글의 텍스트를 분석하여 긍정, 부정, 중립 등의 - 감정 상태 표시
- 사용자에게 피드백 제공 및 관리자에게 감정 분석 리포트 제공
- 관리자 기능
- 비속어 사전 관리
- 사용자 관리 및 게시물 관리
- 감정 분석 리포트 조회