Cyberbullying Detection Project

This project focuses on detecting and classifying cyberbullying in text, particularly against the LGBTQ community.

Stage 1 - Gather Data

No code

Stage 2 - Data Pre-Processing

Dataset 1

datasetOnePreprocessing.py - preprocessing the dataset from the Cyberbullying Data for Multi-Label Classification.

Dataset 2

datasetTwoPreprocessing.py - preprocessing the dataset from the Anti LGBTQ Cyberbullying Texts dataset.

After Concatenating Datasets

jointDatasetPreprocessing.py - Concantenates the 2 datasets

Data Visualisation

visualise.py - Creates the visualisation

Run datasetOnePreprocessing.py and datasetTwoPreprocessing.py before running jointDatasetPreprocessing.py.

Stage 3, 4 & 5 - Model Selection, Training, Evaluation, and Prediction

Logistic Regression

logisticRegression.py - The logistic regression model

K-Nearest Neighbours

knn.py - The k-nearest neighbours model

Additional Files

Function for tokenising: Used in like datasetOnePreprocessing.py, datasetTwoPreprocessing.py, and logisticRegression.py.
- stringTokenizationFunc.py

Name		Name	Last commit message	Last commit date
Latest commit History 65 Commits
.vscode		.vscode
preprocessedDatasets		preprocessedDatasets
rawDatasets		rawDatasets
.DS_Store		.DS_Store
.gitignore		.gitignore
README.md		README.md
datasetOnePreprocessing.py		datasetOnePreprocessing.py
datasetTwoPreprocessing.py		datasetTwoPreprocessing.py
jointDatasetPreprocessing.py		jointDatasetPreprocessing.py
knn.py		knn.py
logisticRegression.py		logisticRegression.py
requirements.txt		requirements.txt
stringTokenizationFunc.py		stringTokenizationFunc.py
visualise.py		visualise.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Cyberbullying Detection Project

Stage 1 - Gather Data

Stage 2 - Data Pre-Processing

Dataset 1

Dataset 2

After Concatenating Datasets

Data Visualisation

Stage 3, 4 & 5 - Model Selection, Training, Evaluation, and Prediction

Logistic Regression

K-Nearest Neighbours

Additional Files

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Cyberbullying Detection Project

Stage 1 - Gather Data

Stage 2 - Data Pre-Processing

Dataset 1

Dataset 2

After Concatenating Datasets

Data Visualisation

Stage 3, 4 & 5 - Model Selection, Training, Evaluation, and Prediction

Logistic Regression

K-Nearest Neighbours

Additional Files

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages