Codestin Search App

👋 Sobre Mim

+ 🎓 Cientista de Dados | FATEC
+ 🔧 Especialista em MLOps e Site Reliability Engineering
+ ☁️ Google Cloud Platform (GCP) e Kubernetes
+ 🕸️ Network Science aplicada a sistemas distribuídos
+ 📊 Transformando modelos em produtos escaláveis e confiáveis

Minha missão: Construir sistemas de IA que não apenas funcionam no notebook, mas operam com confiabilidade de 99.9% em produção.

📖 Leia mais sobre minha trajetória

Sou Cientista de Dados formado pela FATEC e dedico minha carreira a aplicar habilidades analíticas para construir sistemas de IA robustos, confiáveis e escaláveis.

Meu principal diferencial é a capacidade de transitar fluidamente entre a modelagem estatística complexa e a engenharia de software de alta performance. Minha abordagem vai além do simples treinamento de modelos; eu me concentro em projetar, construir e validar a infraestrutura completa de MLOps e Dados para garantir que as soluções operem com máxima confiabilidade e eficiência no mundo real.

O que me move:

🎯 Resolver problemas complexos de escalabilidade e confiabilidade
🚀 Automatizar pipelines end-to-end (do dado bruto ao modelo em produção)
📈 Otimizar custos de infraestrutura (FinOps) sem comprometer performance
🤝 Compartilhar conhecimento através de documentação técnica de qualidade

📈 Impacto em Números

🚀 Deploys Automatizados	☁️ Clusters Gerenciados	📊 TB de Dados Processados	⚡ APIs em Produção	🕸️ Grafos Analisados
25+	6+	15+ TB	8+	100M+ nós

🎯 Foco e Especializações

Atuo na interseção entre Data Science, MLOps e SRE (Site Reliability Engineering), transformando protótipos em produtos resilientes.

⚙️ MLOps e Cloud Architecture Deploy de modelos em Kubernetes (GKE) CI/CD com GitHub Actions Infraestrutura como Código com Terraform Orquestração de sistemas distribuídos Containerização com Docker e Helm	☁️ Data Engineering Pipelines ELT no GCP (BigQuery) Streaming com Apache Kafka e Pub/Sub Processamento distribuído com Dataproc Otimização de performance e custos Modelagem dimensional
🕸️ Graph Analytics & Network Science GraphFrames para processamento distribuído Algoritmos de centralidade (PageRank, Betweenness) Detecção de comunidades (LPA, Louvain) Análise de redes scale-free Validação estatística de topologias	🤖 Machine Learning e GenAI Arquiteturas RAG (Retrieval-Augmented Generation) Fine-tuning de LLMs Modelos de classificação e regressão NLP e análise de sentimentos NLTK VADER para sentiment analysis
🛡️ Site Reliability Engineering Análise de performance com Locust Monitoramento: Prometheus e Grafana APIs de alta disponibilidade (FastAPI) Observabilidade end-to-end Checkpoint strategies e fault tolerance

🚀 Projetos em Destaque

🦄 MLOps End-to-End: Kubernetes e CI/CD

Stack: GKE Docker FastAPI GitHub Actions Helm

Solução completa de deploy para API de Churn Prediction rodando em Cluster Kubernetes (GKE) com máxima confiabilidade e segurança.

✨ Highlights:

🔐 Autenticação OIDC (Keyless Security)
⚡ Load Balancer com Auto-scaling horizontal
🔄 CI/CD Pipeline para deploy contínuo
📊 Monitoramento com Prometheus e Grafana
🛡️ Health Checks e Readiness Probes

📂 Ver Repositório | 📖 Documentação Técnica

☁️ Data Engineering: Pipeline ELT no Google Cloud

Stack: GCP BigQuery SQL Looker Parquet

Arquitetura de dados moderna transformando dados brutos de Táxis de NY (200M+ registros) em insights de negócio através de modelagem dimensional.

✨ Highlights:

📊 Window Functions para análise temporal
💰 Particionamento para otimização de custos
🔍 Índices estratégicos para consultas sub-segundo
📈 Dashboards executivos no Looker Studio
⚡ Performance tuning (redução de 70% no tempo de query)

📂 Ver Repositório | 📊 Dashboard Demo

🛡️ SRE para Big Data: Benchmark de Kafka no Kubernetes

Stack: Kafka Kubernetes Strimzi Prometheus Locust

Análise profunda de performance de cluster Kafka para otimizar ingestão de dados em larga escala. Estudo completo de throughput vs. latência.

✨ Highlights:

📈 Stress Testing com 10K+ msgs/sec
🎯 Tuning de produtores e consumidores
📊 Observabilidade completa (Prometheus + Grafana)
💡 Redução de 40% no consumo de memória (KRaft Mode)
📝 Documentação de ADRs (Architecture Decision Records)

📂 Ver Repositório | 📈 Resultados

⚡ GCP Real-Time Sentiment Pipeline (Hybrid Architecture)

Stack: GCP Dataproc Pub/Sub Terraform Apache Spark BigQuery Looker Studio

Pipeline híbrido de streaming para análise de sentimentos que se adapta automaticamente entre ambiente local (Kafka) e produção cloud-native (GCP). Infraestrutura provisionada com Terraform em modo zero-touch.

✨ Highlights:

☁️ Arquitetura Híbrida com detecção automática de ambiente
💰 FinOps Otimizado (~$9/mês com auto-delete e2-standard-4)
🏗️ IaC Completo (Terraform modules para Dataproc, BigQuery, Pub/Sub)
⚡ Exactly-once semantics com checkpointing GCS
📊 Dashboard Looker com métricas em tempo real

📂 Ver Repositório | 📖 Arquitetura Detalhada

🤖 Real-Time Sentiment Analysis Pipeline (Local)

Stack: Apache Spark Kafka Docker NLTK VADER Pandas UDF

Pipeline de streaming completo para análise de sentimentos em tempo real com latência sub-segundo. Arquitetura event-driven otimizada para FinOps.

✨ Highlights:

⚡ Pandas UDF (3-100x mais rápido que UDFs tradicionais)
💰 Kafka KRaft Mode (redução de 40% em RAM)
🔄 Exactly-once semantics com checkpointing
🐳 Limites de recursos definidos (FinOps)
📊 Throughput: ~200 msgs/seg

📂 Ver Repositório | 🎬 Demo Visual

🕸️ GraphX Community Detection Engine

Stack: Apache Spark GraphFrames Docker NetworkX Kubernetes

Pipeline distribuído enterprise-grade para detecção de comunidades em grafos massivos com suporte a milhões de nós. Implementação de algoritmos científicos (PageRank, Label Propagation) com otimizações de performance para ambientes distribuídos.

✨ Highlights:

🚀 Auto-scaling dinâmico de partições baseado em recursos
📊 Lei de Potência validada (Barabási-Albert model)
⚡ AQE Enabled (Adaptive Query Execution)
🎯 Checkpoint Strategy para fault tolerance
📈 Análise científica com validação estatística

📂 Ver Repositório | 📊 Performance Benchmarks

🛠️ Stack Tecnológico

🔧 Clique para expandir/recolher

☁️ MLOps e Cloud

📊 Data Streaming e Engineering

🤖 Machine Learning

🛡️ SRE e Observability

💻 Linguagens e Tools

🏆 Certificações e Conquistas

☁️ Cloud & Data Engineering

Curso	Emissor	Conclusão
BigQuery for Data Analysts		Fev 2025
Build and Deploy ML Solutions on Vertex AI		Jan 2025
Hadoop Foundations - Level 1		Dez 2024
Fundamentos de Eng. de Dados		Abr 2025

🧠 Data Science & BI

Curso	Emissor	Conclusão
Power BI para Business Intelligence		Set 2025
Machine Learning Operations (MLOps)		Out 2024
Data Analytics		Fev 2025

🎓 Acadêmico & Idiomas

Título / Grau	Instituição	Status
Cientista de Dados		Em andamento
Engenharia Elétrica		Concluído
Inglês Proficiente (C1)		63/100

📊 GitHub Stats

🌟 Open Source e Contribuições

Projeto	Tipo	Contribuição	Status
Apache Kafka	Issue Report	Documentação de edge case em producers	🔄 Aberto
Strimzi Operator	Discussion	Boas práticas de tuning de performance	✅ Aceito
FastAPI	Issue Report	K8s deployment best practices	🔄 Em discussão

💡 Contribua comigo: Se você tem projetos open source relacionados a MLOps, Data Engineering ou SRE, adoraria colaborar!

📝 Artigos e Conteúdo Técnico

🚀 Em breve: Série de artigos técnicos sobre MLOps, SRE e Data Engineering

📌 Tópicos planejados:

Como Reduzir 40% do Custo de Infraestrutura com Kafka KRaft
MLOps na Prática: De Jupyter Notebook para GKE em 30 minutos
Graph Analytics em Escala: Apache Spark + GraphFrames para 100M+ Nós
Pandas UDF vs UDFs Tradicionais: Benchmark Real de Performance
Site Reliability Engineering para Pipelines de Dados
Arquitetura Híbrida: Do Desenvolvimento Local para GCP em 5 Minutos
Lei de Potência em Redes Sociais: Validação Científica com NetworkX

🤝 Vamos Construir Algo Juntos?

Estou aberto a:

🚀 Consultorias em MLOps e Cloud Architecture
💼 Oportunidades de colaboração em projetos desafiadores
🎤 Palestras técnicas sobre SRE e Data Engineering
🤝 Mentorias em Data Science e MLOps

_{⚡ Construído com dedicação por Alex Mendes | Última atualização: Dezembro 2025}

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

👋 Sobre Mim

📈 Impacto em Números

🎯 Foco e Especializações

⚙️ MLOps e Cloud Architecture

☁️ Data Engineering

🕸️ Graph Analytics & Network Science

🤖 Machine Learning e GenAI

🛡️ Site Reliability Engineering