Senior Data Engineer · DataOps & MLOps · AI Engineer
15+ anos · Itaú · Santander · Bradesco · Ambev · PicPay · Brasil 🇧🇷 (Remoto)
▸ Ver Projetos Contato15+ anos entregando plataformas de dados de alta complexidade para os maiores bancos e empresas do Brasil — Itaú, Santander, Bradesco, Ambev e PicPay.
Especialista em Medallion Architecture, Delta Lake, CI/CD para dados e migrações AWS/Azure. Fundador do AuditAI — plataforma SaaS de auditoria inteligente com IA.
Atualmente cursando Pós-Graduação em Cloud & AI DevOps na Faculdade Impacta (2026-2027).
Construiu esteira CI/CD enterprise do zero — 9 stacks Terraform, Unity Catalog, Private Endpoints, TFLint, Terrascan e 2 gates de aprovação humana.
Data Mesh para Itaú Unibanco — modernização de Mainframe, pipelines AWS Glue, Lambda, Step Functions e Terraform IaC.
Migração Parquet → Delta Lake — redução de +50% no tempo de job e custo. Databricks Auto-Scaling via Airflow.
Início de carreira em Business Intelligence. ETL, modelagem dimensional e SQL Server para clientes do setor financeiro.
Expertise completa em engenharia de dados — da ingestão bruta até analytics prontos para o negócio, com CI/CD e IA integrados.
Medallion Architecture (Bronze/Silver/Gold) com Delta Lake, Star Schema, Unity Catalog e Single Source of Truth.
Pipelines CI/CD enterprise para Databricks com Terraform, GitHub Actions e Azure DevOps — dev, staging e prod com gates de qualidade automatizados.
Ferramentas com IA usando MLflow, LangChain e FastAPI. Pipelines MLOps com retreinamento contínuo e versionamento de modelos.
Tecnologias que uso diariamente em projetos de produção.
Transformações PySpark, Delta Lake MERGE, clusters Auto-Scaling, Databricks Jobs, governança Unity Catalog. 3x certificado.
Orquestração de DAGs complexas, geração dinâmica de tasks, sensors, operadores customizados e integração CI/CD.
S3, Athena, Glue, Redshift, Lambda, Step Functions, EMR, CloudWatch, IAM — pipelines de produção para bancos Tier-1.
ADF, ADLS Gen2, Azure Databricks, DevOps, Key Vault com CMK, Private Endpoints e VNet Injection.
9 stacks enterprise IaC para Azure Databricks — tfstate isolado, Smart Import, TFLint, Terrascan e gates de aprovação.
MLflow, LangChain, FastAPI, SpaCy, Scikit-learn — construiu o AuditAI SaaS do zero, em produção e ao vivo.
Projetos enterprise combinando Engenharia de Dados, DevOps e IA.
Analisador de segurança Terraform combinando engine de regras estáticas com Claude AI. Detecta vulnerabilidades, secrets hardcoded, security groups abertos e anti-padrões de arquitetura. Retorna score de segurança 0-100 com sugestões de correção.
⌥ GitHubMedallion Architecture ponta a ponta (Bronze→Silver→Gold) para dados financeiros. Gerador de dados sintéticos, transformações PySpark, upserts Delta MERGE, modelagem Star Schema e dashboard Streamlit consumindo a camada Gold.
⌥ GitHubTemplate de pipeline CI/CD enterprise para Engenharia de Dados no Databricks. GitHub Actions com gates de qualidade, testes automatizados, checks de qualidade de dados e deploy multi-ambiente (dev→staging→prod) com aprovações manuais.
⌥ GitHubPoC de streaming para dados de medição de energia elétrica baseado em projeto real da CCEE. Originalmente construído com AWS API Gateway + Kinesis + Flink + DynamoDB. Simulado on-premise com FastAPI + Kafka + PySpark Streaming + SQLite.
⌥ GitHubPlataforma SaaS de auditoria inteligente com IA baseada nas normas ISO 31000 e ISO 37301. RandomForest + MLflow com retreinamento contínuo, detecção de dados sensíveis via NLP/SpaCy e gestão de riscos com matriz 5x5.
▸ App Ao Vivo ⌥ GitHubProjetos de exploração e aprendizado — experimentos com dados públicos, Databricks e Python.
Insights para redução de custo de infraestrutura utilizando instâncias Spot da AWS. Análise de economia e recomendações automatizadas com Streamlit e Python.
⌥ GitHubAnálises avançadas de sequências de DNA e RNA usando Databricks e Biopython — transcrição, tradução para proteínas, cálculo de massa molecular e visualizações gráficas. Projeto acadêmico USP.
⌥ GitHubIngestão e análise de dados de participantes do sistema PIX usando a API Brasil. Coleta de informações, transformação e geração de relatórios analíticos com dados públicos.
⌥ GitHubPipeline de ingestão de dados do Olist (e-commerce) implementando camadas Bronze, Silver e Gold. Dados sobre vendas, clientes, produtos e logística processados com Databricks e PySpark.
⌥ GitHubArquitetura em Databricks para sortear CPFs propensos a obter descontos — análise de perfil de negativados e score de probabilidade de conversão com PySpark.
⌥ GitHubBiblioteca Python para gerar chaves surrogate mascarando IDs usando algoritmos de hashing para Databricks. Garante unicidade e rastreabilidade sem expor IDs originais.
⌥ GitHubAberto a oportunidades remotas — Senior Data Engineer, DataOps Engineer, MLOps Engineer ou Tech Lead. Disponível para contratos PJ em BRL ou USD.