Projeto de Dissertação de Mestrado

Introdução

Este projeto é fruto do trabalho de pesquisa da dissertação de mestrado intitulada "Explorando a Generalização de Classificadores de Notícias Falsas em Português Baseados em Modelos de Linguagem", de autoria de Camila Gusmão, com orientação da professora Aline Paes, no Programa de Pós-Graduação em Computação da Universidade Federal Fluminense (UFF).

A maior parte do projeto foi desenvolvida na linguagem Python, com exceção dos experimentos que utilizaram as plataformas CohereAI e MaritalkAI, cujas requisições foram criadas em JavaScript.

Organização do repositório

O repositório está organizado da seguinte forma:

/eda: contém a análise dos dados dos datasets selecionados
/dataset: contempla os dados em suas diferentes versões, sejam os dados originais coletados, trabalhados durante a análise de dados, pré-processados ou modificados para envio de requisições para plataformas fechadas como a CohereAI.
/models: guarda os modelos treinados (aqui não disponíveis, mas passíveis de serem recriados via código).
/results: guarda os resultados dos experimentos realizados, desde dados crus até as métricas finais geradas para avaliação.
/src: contém o cerne do projeto, com todos os códigos desenvolvidos para construção dos experimentos e a configuração adotada por eles (arquivo config.json). Os códigos estão dispostos em:
- /consolidating_results
- /evaluate
- /fine_tuning
- /preprocessing
- /utils
- /zero_shot
/general_analysis: apresenta as análises gerais dos conjuntos de dados aqui trabalhados.

Setup

A criação do ambiente pode ser feita via requirements.txt ou utilizando algum framework de apoio. Neste projeto utilizamos o framework uv.

Montagem de ambiente via pip

pip install -r requirements.txt

Montagem de ambiente via uv

uv install

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
dataset/original		dataset/original
eda		eda
general_analysis		general_analysis
results/metrics		results/metrics
src		src
.gitignore		.gitignore
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
__init__.py		__init__.py
package.json		package.json
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
run.py		run.py
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Projeto de Dissertação de Mestrado

Introdução

Organização do repositório

Setup

Montagem de ambiente via pip

Montagem de ambiente via uv

Execução dos experimentos

Citações

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

License

MeLLL-UFF/LMFactCheck

Folders and files

Latest commit

History

Repository files navigation

Projeto de Dissertação de Mestrado

Introdução

Organização do repositório

Setup

Montagem de ambiente via pip

Montagem de ambiente via uv

Execução dos experimentos

Citações

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages