Thanks to visit codestin.com
Credit goes to github.com

Skip to content

alex3ai/alex3ai

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 

Repository files navigation

LinkedIn Email Profile Views


👋 Sobre Mim

+ 🎓 Cientista de Dados | FATEC
+ 🔧 Especialista em MLOps e Site Reliability Engineering
+ ☁️ Google Cloud Platform (GCP) e Kubernetes
+ 🕸️ Network Science aplicada a sistemas distribuídos
+ 📊 Transformando modelos em produtos escaláveis e confiáveis

Minha missão: Construir sistemas de IA que não apenas funcionam no notebook, mas operam com confiabilidade de 99.9% em produção.

📖 Leia mais sobre minha trajetória

Sou Cientista de Dados formado pela FATEC e dedico minha carreira a aplicar habilidades analíticas para construir sistemas de IA robustos, confiáveis e escaláveis.

Meu principal diferencial é a capacidade de transitar fluidamente entre a modelagem estatística complexa e a engenharia de software de alta performance. Minha abordagem vai além do simples treinamento de modelos; eu me concentro em projetar, construir e validar a infraestrutura completa de MLOps e Dados para garantir que as soluções operem com máxima confiabilidade e eficiência no mundo real.

O que me move:

  • 🎯 Resolver problemas complexos de escalabilidade e confiabilidade
  • 🚀 Automatizar pipelines end-to-end (do dado bruto ao modelo em produção)
  • 📈 Otimizar custos de infraestrutura (FinOps) sem comprometer performance
  • 🤝 Compartilhar conhecimento através de documentação técnica de qualidade

📈 Impacto em Números

🚀 Deploys Automatizados ☁️ Clusters Gerenciados 📊 TB de Dados Processados ⚡ APIs em Produção 🕸️ Grafos Analisados
25+ 6+ 15+ TB 8+ 100M+ nós

🎯 Foco e Especializações

Atuo na interseção entre Data Science, MLOps e SRE (Site Reliability Engineering), transformando protótipos em produtos resilientes.

⚙️ MLOps e Cloud Architecture

  • Deploy de modelos em Kubernetes (GKE)
  • CI/CD com GitHub Actions
  • Infraestrutura como Código com Terraform
  • Orquestração de sistemas distribuídos
  • Containerização com Docker e Helm

☁️ Data Engineering

  • Pipelines ELT no GCP (BigQuery)
  • Streaming com Apache Kafka e Pub/Sub
  • Processamento distribuído com Dataproc
  • Otimização de performance e custos
  • Modelagem dimensional

🕸️ Graph Analytics & Network Science

  • GraphFrames para processamento distribuído
  • Algoritmos de centralidade (PageRank, Betweenness)
  • Detecção de comunidades (LPA, Louvain)
  • Análise de redes scale-free
  • Validação estatística de topologias

🤖 Machine Learning e GenAI

  • Arquiteturas RAG (Retrieval-Augmented Generation)
  • Fine-tuning de LLMs
  • Modelos de classificação e regressão
  • NLP e análise de sentimentos
  • NLTK VADER para sentiment analysis

🛡️ Site Reliability Engineering

  • Análise de performance com Locust
  • Monitoramento: Prometheus e Grafana
  • APIs de alta disponibilidade (FastAPI)
  • Observabilidade end-to-end
  • Checkpoint strategies e fault tolerance

🚀 Projetos em Destaque

🦄 MLOps End-to-End: Kubernetes e CI/CD

Stack: GKE Docker FastAPI GitHub Actions Helm

Solução completa de deploy para API de Churn Prediction rodando em Cluster Kubernetes (GKE) com máxima confiabilidade e segurança.

✨ Highlights:

  • 🔐 Autenticação OIDC (Keyless Security)
  • Load Balancer com Auto-scaling horizontal
  • 🔄 CI/CD Pipeline para deploy contínuo
  • 📊 Monitoramento com Prometheus e Grafana
  • 🛡️ Health Checks e Readiness Probes

📂 Ver Repositório | 📖 Documentação Técnica


☁️ Data Engineering: Pipeline ELT no Google Cloud

Stack: GCP BigQuery SQL Looker Parquet

Arquitetura de dados moderna transformando dados brutos de Táxis de NY (200M+ registros) em insights de negócio através de modelagem dimensional.

✨ Highlights:

  • 📊 Window Functions para análise temporal
  • 💰 Particionamento para otimização de custos
  • 🔍 Índices estratégicos para consultas sub-segundo
  • 📈 Dashboards executivos no Looker Studio
  • Performance tuning (redução de 70% no tempo de query)

📂 Ver Repositório | 📊 Dashboard Demo


🛡️ SRE para Big Data: Benchmark de Kafka no Kubernetes

Stack: Kafka Kubernetes Strimzi Prometheus Locust

Análise profunda de performance de cluster Kafka para otimizar ingestão de dados em larga escala. Estudo completo de throughput vs. latência.

✨ Highlights:

  • 📈 Stress Testing com 10K+ msgs/sec
  • 🎯 Tuning de produtores e consumidores
  • 📊 Observabilidade completa (Prometheus + Grafana)
  • 💡 Redução de 40% no consumo de memória (KRaft Mode)
  • 📝 Documentação de ADRs (Architecture Decision Records)

📂 Ver Repositório | 📈 Resultados


⚡ GCP Real-Time Sentiment Pipeline (Hybrid Architecture)

Stack: GCP Dataproc Pub/Sub Terraform Apache Spark BigQuery Looker Studio

Pipeline híbrido de streaming para análise de sentimentos que se adapta automaticamente entre ambiente local (Kafka) e produção cloud-native (GCP). Infraestrutura provisionada com Terraform em modo zero-touch.

✨ Highlights:

  • ☁️ Arquitetura Híbrida com detecção automática de ambiente
  • 💰 FinOps Otimizado (~$9/mês com auto-delete e2-standard-4)
  • 🏗️ IaC Completo (Terraform modules para Dataproc, BigQuery, Pub/Sub)
  • Exactly-once semantics com checkpointing GCS
  • 📊 Dashboard Looker com métricas em tempo real

📂 Ver Repositório | 📖 Arquitetura Detalhada


🤖 Real-Time Sentiment Analysis Pipeline (Local)

Stack: Apache Spark Kafka Docker NLTK VADER Pandas UDF

Pipeline de streaming completo para análise de sentimentos em tempo real com latência sub-segundo. Arquitetura event-driven otimizada para FinOps.

✨ Highlights:

  • Pandas UDF (3-100x mais rápido que UDFs tradicionais)
  • 💰 Kafka KRaft Mode (redução de 40% em RAM)
  • 🔄 Exactly-once semantics com checkpointing
  • 🐳 Limites de recursos definidos (FinOps)
  • 📊 Throughput: ~200 msgs/seg

📂 Ver Repositório | 🎬 Demo Visual


🕸️ GraphX Community Detection Engine

Stack: Apache Spark GraphFrames Docker NetworkX Kubernetes

Pipeline distribuído enterprise-grade para detecção de comunidades em grafos massivos com suporte a milhões de nós. Implementação de algoritmos científicos (PageRank, Label Propagation) com otimizações de performance para ambientes distribuídos.

✨ Highlights:

  • 🚀 Auto-scaling dinâmico de partições baseado em recursos
  • 📊 Lei de Potência validada (Barabási-Albert model)
  • AQE Enabled (Adaptive Query Execution)
  • 🎯 Checkpoint Strategy para fault tolerance
  • 📈 Análise científica com validação estatística

📂 Ver Repositório | 📊 Performance Benchmarks


🛠️ Stack Tecnológico

🔧 Clique para expandir/recolher

☁️ MLOps e Cloud
Kubernetes GCP Dataproc Pub/Sub Docker GitHub Actions Helm Terraform

📊 Data Streaming e Engineering
Kafka Spark GraphFrames NetworkX BigQuery Looker Studio SQL Pandas

🤖 Machine Learning
Scikit-Learn PyTorch TensorFlow NLTK

🛡️ SRE e Observability
Prometheus Grafana FastAPI

💻 Linguagens e Tools
Python Bash Git Linux VS Code


🏆 Certificações e Conquistas

☁️ Cloud & Data Engineering

Curso Emissor Conclusão
BigQuery for Data Analysts Google Cloud Fev 2025
Build and Deploy ML Solutions on Vertex AI Google Cloud Jan 2025
Hadoop Foundations - Level 1 IBM Dez 2024
Fundamentos de Eng. de Dados DSA Abr 2025

🧠 Data Science & BI

Curso Emissor Conclusão
Power BI para Business Intelligence DSA Set 2025
Machine Learning Operations (MLOps) Google Cloud Out 2024
Data Analytics SENAI Fev 2025

🎓 Acadêmico & Idiomas

Título / Grau Instituição Status
Cientista de Dados FATEC Em andamento
Engenharia Elétrica UNIMAR Concluído
Inglês Proficiente (C1) EF SET 63/100

📊 GitHub Stats

GitHub Streak

Contribution Graph


🌟 Open Source e Contribuições

Projeto Tipo Contribuição Status
Apache Kafka Issue Report Documentação de edge case em producers 🔄 Aberto
Strimzi Operator Discussion Boas práticas de tuning de performance ✅ Aceito
FastAPI Issue Report K8s deployment best practices 🔄 Em discussão

💡 Contribua comigo: Se você tem projetos open source relacionados a MLOps, Data Engineering ou SRE, adoraria colaborar!


📝 Artigos e Conteúdo Técnico

🚀 Em breve: Série de artigos técnicos sobre MLOps, SRE e Data Engineering

📌 Tópicos planejados:

  • Como Reduzir 40% do Custo de Infraestrutura com Kafka KRaft
  • MLOps na Prática: De Jupyter Notebook para GKE em 30 minutos
  • Graph Analytics em Escala: Apache Spark + GraphFrames para 100M+ Nós
  • Pandas UDF vs UDFs Tradicionais: Benchmark Real de Performance
  • Site Reliability Engineering para Pipelines de Dados
  • Arquitetura Híbrida: Do Desenvolvimento Local para GCP em 5 Minutos
  • Lei de Potência em Redes Sociais: Validação Científica com NetworkX

🤝 Vamos Construir Algo Juntos?

Estou aberto a:

🚀 Consultorias em MLOps e Cloud Architecture
💼 Oportunidades de colaboração em projetos desafiadores
🎤 Palestras técnicas sobre SRE e Data Engineering
🤝 Mentorias em Data Science e MLOps



Footer
⚡ Construído com dedicação por Alex Mendes | Última atualização: Dezembro 2025

About

Meu perfil público (README)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published