Skip to content

TioSam77/Simulacion-Movilidad-Spark

Repository files navigation

🚲 Análisis de Movilidad Urbana con PySpark

Python Spark License: GPL v2

Este proyecto realiza un análisis distribuido de datos simulados de movilidad urbana en la Ciudad de México, utilizando Apache Spark.


💡 Descripción General

Se procesaron más de 1000 registros simulados de viajes de bicicleta compartida en la CDMX para analizar:

  • Horarios de mayor congestión.
  • Rutas más concurridas.
  • Estaciones de mayor actividad.

Se utilizó PySpark para manejar los datos de forma distribuida y Matplotlib para visualizar los resultados.


⚙️ Tecnologías utilizadas

  • Python 3.12+
  • Apache Spark 3.5.0 (PySpark)
  • Pandas
  • Matplotlib

🗺️ Diagrama del proceso

📎 Diagrama de flujo de vialidad.pdf


📊 Visualización generada

📎 grafica_origenes.png


📁 Archivos del Proyecto


✅ Uso ético de IA

Durante el desarrollo de esta práctica se utilizó inteligencia artificial como asistencia técnica para:

  • Generación de datasets simulados.
  • Estructuración de código y corrección de errores.
  • Formato y presentación del repositorio.

El uso fue documentado de manera responsable como apoyo al aprendizaje.


✨ Conclusión

El proyecto permitió aplicar Apache Spark para procesamiento distribuido en un escenario urbano realista, logrando optimizar consultas, resúmenes y análisis masivos de movilidad de forma eficiente.

About

Análisis de movilidad urbana usando PySpark, Pandas y Matplotlib.

Topics

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages