Pipeline de Traitement de Données par Chunks

Description

Ce projet implémente un pipeline de traitement de données volumineuses par chunks pour faciliter l’analyse et optimiser l’utilisation de la mémoire. Chaque chunk est chargé, résumé, optimisé, et prêt pour un traitement ou stockage ultérieur.

Fonctionnalités principales / Features

✅ Chargement des données en chunks pour éviter la surcharge mémoire
✅ Résumé des chunks avant et après optimisation
✅ Optimisation mémoire via conversion des types de données et catégorisation
✅ Logs détaillés pour suivre chaque étape du traitement
✅ Nettoyage et normalisation des données clients
✅ Calcul des KPI : chiffre d’affaires, taille des paniers, nombre de clients
✅ Validation des codes pays ISO 3166-1 alpha-2 avec pycountry
✅ Testable avec pytest

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
customer_analytics		customer_analytics
report		report
tests		tests
.gitignore		.gitignore
README.md		README.md
main.py		main.py
requirement.txt		requirement.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Pipeline de Traitement de Données par Chunks

Description

Fonctionnalités principales / Features

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Pipeline de Traitement de Données par Chunks

Description

Fonctionnalités principales / Features

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages