Skip to content

ohyu628/Badword_Filter

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

35 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

팀앤드(&)

온라인 커뮤니티에서 건전한 소통을 위한 비속어 필터링과 긍정적, 부정적 댓글을 보다 편리하게 분류하기 위한 감정 분석 기능이 있는 웹 게시판입니다.


Team


김수아

백엔드

김수연

모델

정모은

데이터분석

지민철

데이터엔지니어(팀장)

오유빈

데이터엔지니어

최재웅

데이터분석

1. 프로젝트 개요

[문제현상]

온라인 커뮤니티에서 욕설 등 건전한 소통이 잘 되고 있지 않은 것 같다고 판단하였다.


[솔루션]

사용자들이 보다 책임간 있는 방식으로 소통할 수 있도록 유도하고 긍정적이고 건전한 커뮤니티 문화 조성하여 온라인 커뮤니티에서의 건전한 소통을 촉진합니다. 관리자가 커뮤니티 관리하는 시간과 노력을 절감하도록 합니다.


2. 기획 및 개발 일정 (WBS)

요구사항 정의서

  • 비속어 필터링 요구사항
    • 비속어 사전은 관리자가 업데이트 가능해야 함
    • 실시간으로 텍스트 검사가 이루어져야 함
    • 비속어가 포함된 게시글 및 댓글은 게시 전에 사용자에게 경고 메시지 표시
  • 감정 분석 요구사항
    • 텍스트 감정 분석을 위해 NLP 기술 사용
    • 분석 결과는 긍정, 부정, 중립으로 분류
    • 분석 결과를 사용자와 관리자에게 시각적으로 표시

WBS

  • 1일차

    • 비속어 데이터 크롤링
    • 일반 댓글 카테고리화 하여 크롤링
    • AWS환경 구축
    • Django로 백엔드 작업 시작
    • 비속어 모델 설계 시작
    • 감정분석 모델 설계 시작
  • 2일차

    • hadoop에 데이터 적재
    • 학습을 위한 데이터 전처리(pandas, pyspark)
    • 모델 학습 시작
  • 3일차

    • 비속어 모델 성능 미달로 다른 방법으로 대체
    • 감정 분석 학습 데이터 늘려서 재학습
    • 비속어를 리스트화 해서 웹에 적용시도
  • 4일차

    • 감정분석 모델 pth로 저장하여서 웹에 적용
    • 비속어 필터 웹에 적용

기능 명세서

  • 회원가입 및 로그인
    • 이메일 인증을 통한 사용자 가입
    • 비밀번호 암호화 저장
  • 게시판 기능
    • 게시글 작성, 조회, 수정, 삭제
    • 댓글 작성, 조회, 수정, 삭제
    • 카테고리별 게시글 분류
  • 비속어 필터링
    • 게시글 및 댓글 작성 시 비속어 사전을 통한 필터링
    • 검출된 비속어는 자동으로 가려짐 또는 경고 메시지와 함께 게시 거부
  • 감정 분석
    • 게시글 및 댓글의 텍스트를 분석하여 긍정, 부정, 중립 등의 - 감정 상태 표시
    • 사용자에게 피드백 제공 및 관리자에게 감정 분석 리포트 제공
  • 관리자 기능
    • 비속어 사전 관리
    • 사용자 관리 및 게시물 관리
    • 감정 분석 리포트 조회

3. 개발

기술스택

Environment

Development

Communication


Hadoop 환경구축

Spark 환경구축

Model 서빙

전체적인 아키텍처

회고

출처 사이트

About

✏️ 비속어 필터링 및 감정 분석 기능 구현

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors