Este proyecto corresponde a un análisis exploratorio de un dataset de productos de Amazon, utilizando Python y Jupyter Notebook.
El objetivo principal fue responder preguntas clave relacionadas con categorías, precios, descuentos, reseñas y puntuaciones de los productos.
- Python 3
- Jupyter Notebook
- Pandas
- Matplotlib / Seaborn
- ¿Qué tipos de productos se manejan en este dataset de Amazon?
- ¿Las marcas con más productos son también las mejor calificadas?
- ¿Qué categorías tienen los precios promedio más altos, más bajos y mayores descuentos?
- ¿Existe relación entre porcentaje de descuento y calificación promedio?
- ¿Existe relación entre cantidad de reseñas y puntuación?
amazon.ipynb→ Notebook principal con la limpieza, análisis y visualizaciones. Ver aquíFicha técnicaVer aquí
Se identificaron múltiples categorías de productos, con mayor presencia en:
- Home & Kitchen
- Electronics
- Computers & Accessories
- Algunas marcas concentran gran cantidad de productos.
- Conclusión: Tener más productos no garantiza una mejor calificación promedio.
- Precios más altos: Electronics
- Precios más bajos: Toys & Games
- Descuentos más altos: Home Improvement
- Se graficó la relación entre % de descuento y calificación promedio.
- Conclusión: Mayores descuentos no implican mejores puntuaciones.
- No se encontró correlación clara entre la cantidad de reseñas y la puntuación promedio.
- Diversificar productos en categorías como Musical Instruments, Health & Personal Care, Home Improvement.
- Explorar precios flexibles en categorías como Toys & Games y Home Improvement.
- Descuentos no aseguran buena reputación, no existe relación directa con las puntuaciones.
- Número de reseñas ≠ calidad: una gran cantidad de reseñas no implica mejores calificaciones.