En este repositorio se presenta el primer Trabajo Práctico para la materia Laboratorio de Datos de la carrera de Licenciatura en Ciencia de Datos.
Los temas evaluados, de la materia, son:
- Diagramas de Entidad-Relación (DER)
- Modelos relacionales
- Calidad de los datos
- Manipulación y limpieza de los datos
- Análisis y visualización de los datos
Saber si existe cierta relación entre el PBI (Producto Bruto Interno) por persona de cada país (año 2022) y la cantidad de sedes en el exterior que tiene Argentina en dicho país, mediante la utilización de datos del Banco Mundial y Ministerio de Relaciones Exteriores, Comercio Internacional y Culto.
- PBI per cápita de los países (PBI en inglés es GDP, por Gross Domestic Product). Se puede obtener del sitio del Banco Mundial: https://data.worldbank.org/indicator/NY.GDP.PCAP.CD, descargando los csv y accediendo al archivo API_NY.GDP.PCAP.CD_DS2_en_csv_v2_6298251.csv
- Representaciones Argentinas. El responsable de estas fuentes de datos es el actual
Ministerio de Relaciones Exteriores, Comercio Internacional y Culto, y pueden ser obtenidas
del sitio que se detalla a continuación:
https://datos.gob.ar/dataset/exterior-representaciones-argentinas. En dicho sitio podrán
acceder a los siguientes datos:
- Datos básicos de las sedes
- Datos completos de las sedes
- Datos completos de las secciones de las sedes
- tp1.pdf: es el informe del proyecto, tanto el análisis como las conclusiones realizadas.
- tp1.py: código utilizado para el análisis de los datos.
-
TablasOriginales: se encuentran los archivos descargados de las fuentes en formato csv.
-
TablasLimpias: se encuentran las tablas normalizadas y limpias de la información seleccionada para realizar el informe.
-
img: se encuentran las imagenes usadas para README.md
inline_sql==0.1.2
matplotlib==3.7.1
numpy==1.25.2
pandas==1.5.3
seaborn==0.13.1
Luego de clonar el repositorio.
pip install -r requirements.txt
Aconsejamos usar un entorno virtual.







