📚 Classificação de Artigos Científicos usando o Título do Artigo e Metadados com ML Tradicional

📌 Visão Geral do Projeto

Este projeto tem como objetivo aplicar algoritmos tradicionais de aprendizado de máquina para a classificação de artigos científicos, utilizando diferentes versões de conjuntos de dados textuais. Os modelos são treinados com base em títulos de artigos, podendo ou não incluir metadados adicionais, e são avaliados em datasets balanceados e desbalanceados.

⚙️ Abordagens Utilizadas

Entrada textual:
- Apenas títulos dos artigos
- Títulos + metadados (como ano, número de autores e pontuação no título)
Balanceamento:
- Dataset balanceado
- Dataset desbalanceado
Modelos testados:
- 9 algoritmos tradicionais de aprendizado de máquina

🧠 Modelos Implementados

Modelo	Tipo	Biblioteca
Regressão Logística	Linear	scikit-learn
Linear SVC	Máquinas de Vetores	scikit-learn
SGDClassifier	Gradiente Estocástico	scikit-learn
MultinomialNB	Naive Bayes	scikit-learn
Random Forest	Ensemble	scikit-learn
Gradient Boosting	Boosting	scikit-learn
XGBoost	Boosting	xgboost
LightGBM	Boosting	lightgbm
MLPClassifier	Rede Neural (MLP)	scikit-learn

🧰 Tecnologias Utilizadas

Linguagem

Python 3.8+

Principais Bibliotecas

# Machine Learning
scikit-learn==1.0.2
xgboost==1.5.1
lightgbm==3.3.2

# Manipulação de Dados
pandas==1.3.5
numpy==1.21.6

# Visualização
matplotlib==3.5.1
seaborn==0.11.2

# Ambiente de Desenvolvimento
jupyter==1.0.0
spacy==3.2.1
nltk==3.6.3

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
License.txt		License.txt
README.md		README.md
code.ipynb		code.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

📚 Classificação de Artigos Científicos usando o Título do Artigo e Metadados com ML Tradicional

📌 Visão Geral do Projeto

⚙️ Abordagens Utilizadas

🧠 Modelos Implementados

🧰 Tecnologias Utilizadas

Linguagem

Principais Bibliotecas

About

Uh oh!

Releases

Packages

Languages

License

getHibou/Above_Average_Citations

Folders and files

Latest commit

History

Repository files navigation

📚 Classificação de Artigos Científicos usando o Título do Artigo e Metadados com ML Tradicional

📌 Visão Geral do Projeto

⚙️ Abordagens Utilizadas

🧠 Modelos Implementados

🧰 Tecnologias Utilizadas

Linguagem

Principais Bibliotecas

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages