Skip to content

Heizhem/tp1

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TP 01: Manejo de datos y su visualización

En este repositorio se presenta el primer Trabajo Práctico para la materia Laboratorio de Datos de la carrera de Licenciatura en Ciencia de Datos.

Los temas evaluados, de la materia, son:

  • Diagramas de Entidad-Relación (DER)
  • Modelos relacionales
  • Calidad de los datos
  • Manipulación y limpieza de los datos
  • Análisis y visualización de los datos

Sobre el Proyecto

Objetivo del proyecto:

Saber si existe cierta relación entre el PBI (Producto Bruto Interno) por persona de cada país (año 2022) y la cantidad de sedes en el exterior que tiene Argentina en dicho país, mediante la utilización de datos del Banco Mundial y Ministerio de Relaciones Exteriores, Comercio Internacional y Culto.

Fuentes

  • PBI per cápita de los países (PBI en inglés es GDP, por Gross Domestic Product). Se puede obtener del sitio del Banco Mundial: https://data.worldbank.org/indicator/NY.GDP.PCAP.CD, descargando los csv y accediendo al archivo API_NY.GDP.PCAP.CD_DS2_en_csv_v2_6298251.csv

  • Representaciones Argentinas. El responsable de estas fuentes de datos es el actual Ministerio de Relaciones Exteriores, Comercio Internacional y Culto, y pueden ser obtenidas del sitio que se detalla a continuación: https://datos.gob.ar/dataset/exterior-representaciones-argentinas. En dicho sitio podrán acceder a los siguientes datos:
    • Datos básicos de las sedes
    • Datos completos de las sedes
    • Datos completos de las secciones de las sedes

Información del Repositorio

Descripción de los archivos

  • tp1.pdf: es el informe del proyecto, tanto el análisis como las conclusiones realizadas.
  • tp1.py: código utilizado para el análisis de los datos.

Descripción de las carpetas

  • TablasOriginales: se encuentran los archivos descargados de las fuentes en formato csv.

  • TablasLimpias: se encuentran las tablas normalizadas y limpias de la información seleccionada para realizar el informe.

  • img: se encuentran las imagenes usadas para README.md

Stack

Información sobre las librerías

Versiones de los módulos/librerías

inline_sql==0.1.2
matplotlib==3.7.1
numpy==1.25.2
pandas==1.5.3
seaborn==0.13.1

Comando para instalar todas las librerías:

Luego de clonar el repositorio.

pip install -r requirements.txt

Aconsejamos usar un entorno virtual.

About

Primer Trabajo Práctico para la materia Laboratorio de Datos de la carrera de Lic. Ciencia de Datos

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages