Software Engineering student at the University of Brasília (UnB) specializing in Analytics Engineering. Focus on building scalable data products through the integration of software best practices and data modeling. Primary interests include Data Governance, Medallion Architecture, and Event-Driven Orchestration.
Certifications & Current Work:
- dbt Fundamentals Certified (dbt Labs), preparing for Analytics Engineering Professional Certification
- Innovation Fellow at Ford, implementing DataOps principles with GCP, Terraform, and CI/CD (Tekton, GitHub Actions)
- Academic researcher in Deep Learning and Computer Vision for healthcare applications
Data Engineer for GovHub, a transparency-focused initiative for government data ingestion and processing.
Key Contributions:
- Development and orchestration of end-to-end data ingestion pipelines using Apache Airflow, ensuring reliable and automated data flows
- Data modeling and transformation using dbt, following the Medallion Architecture (Bronze, Silver, and Gold layers) to build a public Data Lake
- Implementation of Data Governance processes, including integrated data dictionaries and Data Quality routines
- Integration with multiple government APIs (e.g., TransfereGov) with high availability, observability, and Fail-Fast error handling
DF em Obras: End-to-End Modern Data Stack Pipeline
Data pipeline developed to increase public transparency for government infrastructure projects in Brasília.
- Lead Data Engineer role
- Modular data transformations using dbt (Cloud-hybrid architecture with MotherDuck)
- Automated daily ingestion with Python and GitHub Actions
- Repository: github.com/unb-mds/DFemObras
AI for Osteoporosis Screening (Deep Learning)
Computer-Aided Diagnosis (CAD) system using CNNs (AlexNet, EfficientNet) to detect osteoporosis risk from dental radiographs.
- Focus on data preprocessing, model training, and performance metrics in healthcare
Estudante de Engenharia de Software na Universidade de Brasília (UnB) especializado em Analytics Engineering. Foco na construção de produtos de dados escaláveis através da integração de boas práticas de software e modelagem de dados. Interesses principais incluem Governança de Dados, Arquitetura Medallion e Orquestração Orientada a Eventos.
Certificações e Trabalho Atual:
- Certificado em dbt Fundamentals (dbt Labs), em preparação para a certificação profissional de Analytics Engineering
- Bolsista de Inovação na Ford, implementando princípios de DataOps com GCP, Terraform e CI/CD (Tekton, GitHub Actions)
- Pesquisador acadêmico em Deep Learning e Computer Vision para aplicações em saúde
Data Engineer do GovHub, iniciativa de transparência focada na ingestão e processamento de dados governamentais.
Principais Contribuições:
- Desenvolvimento e orquestração de pipelines de ingestão de dados fim a fim utilizando Apache Airflow, garantindo fluxos de dados automatizados e confiáveis
- Modelagem e transformação de dados utilizando dbt, seguindo a Arquitetura Medallion (camadas Bronze, Silver e Gold) para construção de um Data Lake público
- Implementação de processos de Governança de Dados, incluindo dicionários de dados integrados e rotinas de Data Quality
- Integração com diversas APIs governamentais (ex: TransfereGov) com alta disponibilidade, observabilidade e tratamento de falhas (Fail-Fast)
DF em Obras: Pipeline de Modern Data Stack
Pipeline de dados desenvolvido para aumentar a transparência de obras públicas no DF.
- Lead Data Engineer
- Transformações modulares de dados usando dbt (Arquitetura híbrida com MotherDuck)
- Ingestão diária automatizada com Python e GitHub Actions
- Repositório: github.com/unb-mds/DFemObras



