Analísis sobre las obras de William Shakespeare

Este repositorio contiene dos scripts para realizar un análisis sobre los trabajos del escritor William Shakespeare. Se utilizarón librerias conocidas en el entorno de la ciencia de datos, como ser Pandas, Seaborn, Scikit-learn y Fasttext. En el archivo requirements.txt puede encontrar las librerias necesarias.

Se utilizó la siguiente base de datos abierta: Base de datos con las obras de William Shakespeare .

El trabajo se separa en dos partes:

Parte 1

Se realizó un análisis exploratorio sobre los datos, parte del foco estuvo en las obras del escritor, en particular es de interés los años de publicación así como el género, también se realiza un recuento de palabras. Para esta parte se utilizó el scrtip "shakespeare_analysis.ipynb" El resultado de estos análisis se encuentran en el PDF "Informe".

Parte 2

Se profundiza en técnicas de aprendizaje automático para entrenar dos modelos clasicos Multinomial Naive Bayes (MultinomialNB) y Support Vector Machine (SVM) así cómo un modelo especializado llamado Fast-Text para predecir que personaje dice párrafos dado. Para esta parte se trabajó con un conjunto reducido de tres personajes.

Tanto para MultinomialNB como para SVM se aplico la técnica de Cross-Validation para elegir los parámetros óptimos dentro de un set de 28 posibilidades y se realizo sus respectivas matrices de confusiones para comprender el rendimiento de los modelos.

Por otro lado, se experimenta cambiando un personaje con el fin de desbalancear la cantidad de párrafos y entender qué efecto tiene en los modelos.

Para esta parte se utilizó el script "shakespeare_analysis_2.ipynb", y los resultados se encuentran en el PDF "Informe_parte2".

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
Informe.pdf		Informe.pdf
Informe_parte2.pdf		Informe_parte2.pdf
README.md		README.md
requirements.txt		requirements.txt
shakespeare_analysis.ipynb		shakespeare_analysis.ipynb
shakespeare_analysis_2.ipynb		shakespeare_analysis_2.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Analísis sobre las obras de William Shakespeare

Parte 1

Parte 2

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

britsimm/Shakespeare_works_analysis

Folders and files

Latest commit

History

Repository files navigation

Analísis sobre las obras de William Shakespeare

Parte 1

Parte 2

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages