El análisis de datos y el machine learning han conquistado la industria moderna, algunas tareas del machine learning son:
- Sugerir resultados en búsquedas online.
- Reconocimiento de voz en smartphones y software de ofimática.
- Predecir comportamiento de clientes, el clima y un gran etcétera.
En este curso entenderemos el concepto de datos, sus formatos; procesos fundamentales como la limpieza (curación o Data cleaning), métricas explorativas que nos permitiran conducir el análisis, generar visualizaciones y poder realizar el procesamiento para la construcción de modelos predictivos. Desde un componente práctico y uno teórico.
En esta unidad veremos una introducción a diversos trabajos donde se realiza análisis de datos y pondremos a punto los toolkits que utilizaremos durante el curso.
-
Introducción al análisis de datos, toolkit y ejemplos prácticos.
- Tutorial Instalación de Anaconda
-
Repaso de Python.
-
Introducción a Jupyter Notebooks
-
Práctico Python en Jupyter Notebooks
-
-
Paquetes para cálculo científico, ciencia de datos y aprendizaje automático.
- Práctico de Paquetes en Python
-
Introducción a git.
-
Evaluación Ejercicio 1
- Ejercicio 1, Primer Proyecto Github con un Jupyter Notebook
⚠️ A pedido del público he subido un ejemplo de código con jupyter-notebook aquí
El nuevo Jupyter-Notebook que vimos en clases paso a paso lo encuentran aquí
En esta unidad repasaremos herramientas de estadística descriptiva y luego exploraremos el paquete Pandas de Python.
-
Estadística Descriptiva aquí.
-
Formatos de archivos de datos y su manipulación aquí.
-
Pandas y la exploración de datos aquí / Bonus Maps.
-
Filtrado de datos clase 1 y práctico.
4.1 Primera Hora 03 Nov 2021
- Introducción. (SLIDES EN BlackBoard)
- Entrenamiento de Modelos.
- Clasificación.
- Máquinas de vectores de soporte.
- Árboles de decisión y Random Forest.
- Reducción de dimensionalidad.
- Aprendizaje No Supervisado.

