Este repositorio trata sobre tecnologías para almacenar y procesar grandes volúmenes de datos, explicando cuándo usarlas y sus limitaciones. También amplía los conceptos de bases de datos y aborda el procesamiento de flujos de datos para obtener resultados analíticos casi en tiempo real.
- Taller PySPARK Calidad del Agua
- Cuadernos Ejercicios de Python
- Erl Thomas, Big Data Fundamentals: concepts, drivers & techniques, 2015
- Balamurugan, Big Data, Concepts, Technology and Architecture, 2021
- Ilijason Robert, Apache Spark using Azure Databricks, 2020
- Damji, Jules, Learning Spark, 2nd Edition, 2020
- Luu Hien, Beginning Apache Spark 2, 2018