// sobre · lume_analytics

Iluminamos dados em decisões de alto impacto.

Uma boutique de ciência de dados para empresas que precisam de monitoramento em tempo real, modelos preditivos em produção e gestão executiva de projetos de dados.

8+
anos em dados
30+
modelos em produção
7
setores atendidos
120+
dashboards entregues

Trabalhamos com ciência de dados há mais de 8 anos, com foco em setor bancário e financeiro, expandindo para varejo, saúde, logística e indústria. Construímos modelos preditivos do whiteboard à produção, integrados a dashboards executivos que pessoas realmente usam para tomar decisão.

Acreditamos em três coisas: dados limpos vencem modelos sofisticados, métricas de negócio importam mais que AUC e simplicidade escala.

// setores_atendidos

FinançasVarejo / E-commerceSaúdeLogísticaIndústriaTelecomEducação
// 01 — sala de guerra

Painel de guerrilha

KPIs críticos em tempo real, fila de incidentes auto-priorizada e ações rápidas (ack, paginar, rollback, isolar).

sala_de_guerra · resposta a incidentes
armado
P1 ativos
2
P2 ativos
2
TPS
2840
erros/min
42
pulse · stream global de erros
fila de incidentes · 5auto-priorizado
P1INC-284147s

Pico de fraude detectado · cluster sudeste

fraud_rate 0.42% (baseline 0.12%)

setor: Banking · responsável: fraud-squad

registro de auditoria0 eventos
    // 02 — alertas ao vivo

    Feed de alertas em tempo real

    Monitoramento contínuo de modelos, SLAs e operações. Filtre por severidade, setor ou tipo.

    carregando feed em tempo real…

    // 03 — serviços

    O que entregamos

    Da modelagem ao deploy: ciclo completo de ciência de dados orientado a impacto de negócio.

    Monitoramento em tempo real

    Dashboards e alertas em streaming para operações críticas — banco, varejo, saúde, logística e indústria.

    SQL & Data Warehousing

    Modelagem dimensional, otimização de queries e pipelines confiáveis em qualquer cloud.

    Machine Learning aplicado

    Modelos preditivos: churn, score, fraude, recomendação, manutenção preditiva, triagem.

    MLOps em produção

    Deploy, versionamento, monitoramento de drift, retreino automático e observabilidade.

    NLP & busca profunda

    Embeddings, RAG, análise semântica de documentos e classificação de conteúdo.

    Gestão de projetos de dados

    CRISP-DM + Agile, OKRs, governança, squads multidisciplinares e roadmap orientado a impacto.

    // 04 — metodologia

    Como entregamos projetos de dados

    CRISP-DM + Agile + OKRs — do problema de negócio ao modelo em produção, com governança e impacto medido.

    01

    Discovery

    Entender problema, KPI alvo e critérios de sucesso.

    02

    Auditoria de dados

    Mapear fontes, qualidade, gaps e governança.

    03

    Modelagem

    Baselines, experimentação e validação rigorosa.

    04

    Deploy

    API, batch ou streaming — com observabilidade.

    05

    Monitoramento

    Drift, performance e alertas em tempo real.

    06

    Iterar

    Retreino, A/B tests e expansão do escopo.

    trajetória

    2022 — presente

    Consultoria de Dados — Lume Analytics @ Evoluir Corretora · Hapvida · Banpará

    Modelos de risco, fraude e previsão de demanda para clientes de energia, saúde e financeiro. Impacto consolidado: −R$8M/ano em perdas evitadas e +18% em conversão.

    2019 — 2022

    Data Scientist @ Stone Pagamentos · iFood (parceria)

    Modelos de churn de lojistas, recomendação de produtos e BI executivo para diretoria comercial. Squad de 4 pessoas, deploy em produção via AWS SageMaker.

    2017 — 2019

    Data Analyst @ Magazine Luiza · Grupo Boticário

    Dashboards SQL/Power BI para times de marketing e supply chain, primeiros pipelines em Python para forecast de estoque.

    educação

    MSc — Ciência de Dados Aplicada

    USP — ICMC São Carlos · 2021

    BSc — Estatística

    UFPA — Universidade Federal do Pará · 2017

    certificações

    AWS Machine Learning Specialty
    Google Professional Data Engineer
    Databricks Certified ML Associate
    // 05 — vitrine 3d

    Galeria imersiva de projetos

    Navegue pelos cases como capas de um catálogo. Use os controles para girar o anel.

    1 / 10 · clique nas cartas para girar

    // 06 — destaques

    Projetos em destaque

    Cases reais com métricas de impacto mensurável, em múltiplos setores.

    Monitor de Operações em Tempo Real
    Tempo Real · Multi-setor

    Monitor de Operações em Tempo Real

    Plataforma de monitoramento em tempo real (Kafka + ClickHouse + Grafana) com KPIs operacionais, alertas inteligentes e drill-down por área.

    • Latência <2s
    • 120+ KPIs
    • −38% MTTR
    KafkaClickHouseGrafanaPython
    Suíte de Gestão de Projetos de Dados
    Gestão · Dados

    Suíte de Gestão de Projetos de Dados

    Framework de gestão de projetos de dados (CRISP-DM + Agile) com roadmap, OKRs, governança, papéis e rituais — usado em squads multidisciplinares.

    • −30% time-to-prod
    • ROI mensurável
    • 8 squads
    JiraNotiondbtLooker
    Monitor de Fraude Bancária
    Finanças · Tempo Real

    Monitor de Fraude Bancária

    Detecção de fraude transacional em tempo real com XGBoost servido via FastAPI + dashboard de risco para o time de prevenção.

    • −42% perdas
    • AUC 0.97
    • <120ms
    PythonKafkaXGBoostFastAPI
    Analytics & Recomendação E-commerce
    E-commerce · ML

    Analytics & Recomendação E-commerce

    Funil de aquisição em tempo real, atribuição multi-touch e sistema de recomendação personalizado para varejo digital.

    • +24% conversão
    • +18% AOV
    • NDCG 0.81
    PythonSparkAirflowBigQuery
    Preditor de Triagem em Saúde
    Saúde · ML

    Preditor de Triagem em Saúde

    Modelo de classificação de risco para priorização de pacientes em pronto-socorro, integrado ao prontuário eletrônico.

    • F1 0.91
    • −22% TMA
    • 3 hospitais
    Pythonscikit-learnFHIRStreamlit
    ETA & Roteirização Logística
    Logística · Otimização

    ETA & Roteirização Logística

    Previsão de tempo de entrega e otimização de rotas com modelos de gradient boosting e telemetria em streaming.

    • MAE 6.2 min
    • +11% on-time
    • 312 rotas
    PythonLightGBMKafkaPostGIS
    // 07 — toolkit

    Stack técnico

    Ferramentas que usamos diariamente para resolver problemas complexos com dados.

    Linguagens

    • Python
    • SQL
    • R
    • Scala
    • Bash

    ML / Deep Learning

    • scikit-learn
    • XGBoost
    • PyTorch
    • TensorFlow
    • Hugging Face

    Tempo Real / Streaming

    • Kafka
    • Spark Streaming
    • Flink
    • ClickHouse
    • Redis

    Engenharia de Dados

    • Airflow
    • dbt
    • Snowflake
    • BigQuery
    • PostgreSQL

    Visualização

    • Power BI
    • Tableau
    • Looker
    • Grafana
    • Streamlit

    Cloud / MLOps

    • AWS
    • GCP
    • Docker
    • Kubernetes
    • MLflow
    • FastAPI

    Gestão de Projetos

    • Agile/Scrum
    • Kanban
    • CRISP-DM
    • OKRs
    • Jira
    • Notion
    // 08 — cereja do bolo

    Dashboard ao vivo · multi-setor

    Alterne entre os setores e veja KPIs, sparklines e modelos atualizando em tempo real.

    // a_cereja_do_bolo

    Streams reais · decisões reais

    Banco, e-commerce, saúde, logística e indústria — o mesmo padrão arquitetural, calibrado para cada KPI. Latência sub-segundo, modelos versionados, dashboards que os times realmente abrem.

    • ingestão Kafka + ClickHouse
    • features online + offline
    • drift & alertas automáticos
    • SLOs monitorados ponta a ponta
    ao vivo · monitor em tempo real
    --:--:--
    TPS
    2840
    Volume R$
    1.287.400
    Fraud %
    0.12%
    transactions / hour
    fraud_model_v3.2 · auc0.973em produção

    // pronto_para_colaborar

    Vamos transformar seus dados
    em vantagem competitiva.

    iniciar conversa