Skip to content
View CaioMelo25's full-sized avatar

Highlights

  • Pro

Block or report CaioMelo25

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
CaioMelo25/README.md

Header

Typing SVG


English Version

Software Engineering student at the University of Brasília (UnB) specializing in Analytics Engineering. Focus on building scalable data products through the integration of software best practices and data modeling. Primary interests include Data Governance, Medallion Architecture, and Event-Driven Orchestration.

Certifications & Current Work:

  • dbt Fundamentals Certified (dbt Labs), preparing for Analytics Engineering Professional Certification
  • Innovation Fellow at Ford, implementing DataOps principles with GCP, Terraform, and CI/CD (Tekton, GitHub Actions)
  • Academic researcher in Deep Learning and Computer Vision for healthcare applications

Tech Stack

Python Apache Airflow dbt PostgreSQL Google BigQuery Docker Git


Featured Experience

Data Engineer @ Lab Livre — GovHub Data Pipeline

Data Engineer for GovHub, a transparency-focused initiative for government data ingestion and processing.

Key Contributions:

  • Development and orchestration of end-to-end data ingestion pipelines using Apache Airflow, ensuring reliable and automated data flows
  • Data modeling and transformation using dbt, following the Medallion Architecture (Bronze, Silver, and Gold layers) to build a public Data Lake
  • Implementation of Data Governance processes, including integrated data dictionaries and Data Quality routines
  • Integration with multiple government APIs (e.g., TransfereGov) with high availability, observability, and Fail-Fast error handling

Featured Projects

DF em Obras: End-to-End Modern Data Stack Pipeline

Data pipeline developed to increase public transparency for government infrastructure projects in Brasília.

  • Lead Data Engineer role
  • Modular data transformations using dbt (Cloud-hybrid architecture with MotherDuck)
  • Automated daily ingestion with Python and GitHub Actions
  • Repository: github.com/unb-mds/DFemObras

AI for Osteoporosis Screening (Deep Learning)

Computer-Aided Diagnosis (CAD) system using CNNs (AlexNet, EfficientNet) to detect osteoporosis risk from dental radiographs.

  • Focus on data preprocessing, model training, and performance metrics in healthcare

Versão em Português

Estudante de Engenharia de Software na Universidade de Brasília (UnB) especializado em Analytics Engineering. Foco na construção de produtos de dados escaláveis através da integração de boas práticas de software e modelagem de dados. Interesses principais incluem Governança de Dados, Arquitetura Medallion e Orquestração Orientada a Eventos.

Certificações e Trabalho Atual:

  • Certificado em dbt Fundamentals (dbt Labs), em preparação para a certificação profissional de Analytics Engineering
  • Bolsista de Inovação na Ford, implementando princípios de DataOps com GCP, Terraform e CI/CD (Tekton, GitHub Actions)
  • Pesquisador acadêmico em Deep Learning e Computer Vision para aplicações em saúde

Tech Stack

Python Apache Airflow dbt PostgreSQL Google BigQuery Docker Git


Experiência em Destaque

Engenheiro de Dados @ Lab Livre — Pipeline de Dados do GovHub

Data Engineer do GovHub, iniciativa de transparência focada na ingestão e processamento de dados governamentais.

Principais Contribuições:

  • Desenvolvimento e orquestração de pipelines de ingestão de dados fim a fim utilizando Apache Airflow, garantindo fluxos de dados automatizados e confiáveis
  • Modelagem e transformação de dados utilizando dbt, seguindo a Arquitetura Medallion (camadas Bronze, Silver e Gold) para construção de um Data Lake público
  • Implementação de processos de Governança de Dados, incluindo dicionários de dados integrados e rotinas de Data Quality
  • Integração com diversas APIs governamentais (ex: TransfereGov) com alta disponibilidade, observabilidade e tratamento de falhas (Fail-Fast)

Projetos em Destaque

DF em Obras: Pipeline de Modern Data Stack

Pipeline de dados desenvolvido para aumentar a transparência de obras públicas no DF.

  • Lead Data Engineer
  • Transformações modulares de dados usando dbt (Arquitetura híbrida com MotherDuck)
  • Ingestão diária automatizada com Python e GitHub Actions
  • Repositório: github.com/unb-mds/DFemObras

Contato

LinkedIn Email GitHub


GitHub Stats

GitHub stats

Top Langs

Pinned Loading

  1. unb-mds/DFemObras unb-mds/DFemObras Public

    Aplicação web com o objetivo de visualizar de forma interativa as obras públicas do Distrito Federal. O projeto foi desenvolvido na disciplina de 'Métodos de Desenvolvimento de Software' da Univers…

    HTML 4 4

  2. gerenciamento-sol gerenciamento-sol Public

    Projeto com a finalidade de elaborar para minha mãe um software de gerenciamento de vendas

    Dart