Thanks to visit codestin.com
Credit goes to github.com

Skip to content
View alex3ai's full-sized avatar

Block or report alex3ai

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
alex3ai/README.md

LinkedIn Email Profile Views


👋 Sobre Mim

+ 🎓 Cientista de Dados | FATEC
+ 🔧 Especialista em MLOps e Site Reliability Engineering
+ ☁️ Google Cloud Platform (GCP) e Kubernetes
+ 🕸️ Network Science aplicada a sistemas distribuídos
+ 📊 Transformando modelos em produtos escaláveis e confiáveis

Minha missão: Construir sistemas de IA que não apenas funcionam no notebook, mas operam com confiabilidade de 99.9% em produção.

📖 Leia mais sobre minha trajetória

Sou Cientista de Dados formado pela FATEC e dedico minha carreira a aplicar habilidades analíticas para construir sistemas de IA robustos, confiáveis e escaláveis.

Meu principal diferencial é a capacidade de transitar fluidamente entre a modelagem estatística complexa e a engenharia de software de alta performance. Minha abordagem vai além do simples treinamento de modelos; eu me concentro em projetar, construir e validar a infraestrutura completa de MLOps e Dados para garantir que as soluções operem com máxima confiabilidade e eficiência no mundo real.

O que me move:

  • 🎯 Resolver problemas complexos de escalabilidade e confiabilidade
  • 🚀 Automatizar pipelines end-to-end (do dado bruto ao modelo em produção)
  • 📈 Otimizar custos de infraestrutura (FinOps) sem comprometer performance
  • 🤝 Compartilhar conhecimento através de documentação técnica de qualidade

📈 Impacto em Números

🚀 Deploys Automatizados ☁️ Clusters Gerenciados 📊 TB de Dados Processados ⚡ APIs em Produção 🕸️ Grafos Analisados
25+ 6+ 15+ TB 8+ 100M+ nós

🎯 Foco e Especializações

Atuo na interseção entre Data Science, MLOps e SRE (Site Reliability Engineering), transformando protótipos em produtos resilientes.

⚙️ MLOps e Cloud Architecture

  • Deploy de modelos em Kubernetes (GKE)
  • CI/CD com GitHub Actions
  • Infraestrutura como Código com Terraform
  • Orquestração de sistemas distribuídos
  • Containerização com Docker e Helm

☁️ Data Engineering

  • Pipelines ELT no GCP (BigQuery)
  • Streaming com Apache Kafka e Pub/Sub
  • Processamento distribuído com Dataproc
  • Otimização de performance e custos
  • Modelagem dimensional

🕸️ Graph Analytics & Network Science

  • GraphFrames para processamento distribuído
  • Algoritmos de centralidade (PageRank, Betweenness)
  • Detecção de comunidades (LPA, Louvain)
  • Análise de redes scale-free
  • Validação estatística de topologias

🤖 Machine Learning e GenAI

  • Arquiteturas RAG (Retrieval-Augmented Generation)
  • Fine-tuning de LLMs
  • Modelos de classificação e regressão
  • NLP e análise de sentimentos
  • NLTK VADER para sentiment analysis

🛡️ Site Reliability Engineering

  • Análise de performance com Locust
  • Monitoramento: Prometheus e Grafana
  • APIs de alta disponibilidade (FastAPI)
  • Observabilidade end-to-end
  • Checkpoint strategies e fault tolerance

🚀 Projetos em Destaque

🦄 MLOps End-to-End: Kubernetes e CI/CD

Stack: GKE Docker FastAPI GitHub Actions Helm

Solução completa de deploy para API de Churn Prediction rodando em Cluster Kubernetes (GKE) com máxima confiabilidade e segurança.

✨ Highlights:

  • 🔐 Autenticação OIDC (Keyless Security)
  • Load Balancer com Auto-scaling horizontal
  • 🔄 CI/CD Pipeline para deploy contínuo
  • 📊 Monitoramento com Prometheus e Grafana
  • 🛡️ Health Checks e Readiness Probes

📂 Ver Repositório | 📖 Documentação Técnica


☁️ Data Engineering: Pipeline ELT no Google Cloud

Stack: GCP BigQuery SQL Looker Parquet

Arquitetura de dados moderna transformando dados brutos de Táxis de NY (200M+ registros) em insights de negócio através de modelagem dimensional.

✨ Highlights:

  • 📊 Window Functions para análise temporal
  • 💰 Particionamento para otimização de custos
  • 🔍 Índices estratégicos para consultas sub-segundo
  • 📈 Dashboards executivos no Looker Studio
  • Performance tuning (redução de 70% no tempo de query)

📂 Ver Repositório | 📊 Dashboard Demo


🛡️ SRE para Big Data: Benchmark de Kafka no Kubernetes

Stack: Kafka Kubernetes Strimzi Prometheus Locust

Análise profunda de performance de cluster Kafka para otimizar ingestão de dados em larga escala. Estudo completo de throughput vs. latência.

✨ Highlights:

  • 📈 Stress Testing com 10K+ msgs/sec
  • 🎯 Tuning de produtores e consumidores
  • 📊 Observabilidade completa (Prometheus + Grafana)
  • 💡 Redução de 40% no consumo de memória (KRaft Mode)
  • 📝 Documentação de ADRs (Architecture Decision Records)

📂 Ver Repositório | 📈 Resultados


⚡ GCP Real-Time Sentiment Pipeline (Hybrid Architecture)

Stack: GCP Dataproc Pub/Sub Terraform Apache Spark BigQuery Looker Studio

Pipeline híbrido de streaming para análise de sentimentos que se adapta automaticamente entre ambiente local (Kafka) e produção cloud-native (GCP). Infraestrutura provisionada com Terraform em modo zero-touch.

✨ Highlights:

  • ☁️ Arquitetura Híbrida com detecção automática de ambiente
  • 💰 FinOps Otimizado (~$9/mês com auto-delete e2-standard-4)
  • 🏗️ IaC Completo (Terraform modules para Dataproc, BigQuery, Pub/Sub)
  • Exactly-once semantics com checkpointing GCS
  • 📊 Dashboard Looker com métricas em tempo real

📂 Ver Repositório | 📖 Arquitetura Detalhada


🤖 Real-Time Sentiment Analysis Pipeline (Local)

Stack: Apache Spark Kafka Docker NLTK VADER Pandas UDF

Pipeline de streaming completo para análise de sentimentos em tempo real com latência sub-segundo. Arquitetura event-driven otimizada para FinOps.

✨ Highlights:

  • Pandas UDF (3-100x mais rápido que UDFs tradicionais)
  • 💰 Kafka KRaft Mode (redução de 40% em RAM)
  • 🔄 Exactly-once semantics com checkpointing
  • 🐳 Limites de recursos definidos (FinOps)
  • 📊 Throughput: ~200 msgs/seg

📂 Ver Repositório | 🎬 Demo Visual


🕸️ GraphX Community Detection Engine

Stack: Apache Spark GraphFrames Docker NetworkX Kubernetes

Pipeline distribuído enterprise-grade para detecção de comunidades em grafos massivos com suporte a milhões de nós. Implementação de algoritmos científicos (PageRank, Label Propagation) com otimizações de performance para ambientes distribuídos.

✨ Highlights:

  • 🚀 Auto-scaling dinâmico de partições baseado em recursos
  • 📊 Lei de Potência validada (Barabási-Albert model)
  • AQE Enabled (Adaptive Query Execution)
  • 🎯 Checkpoint Strategy para fault tolerance
  • 📈 Análise científica com validação estatística

📂 Ver Repositório | 📊 Performance Benchmarks


🛠️ Stack Tecnológico

🔧 Clique para expandir/recolher

☁️ MLOps e Cloud
Kubernetes GCP Dataproc Pub/Sub Docker GitHub Actions Helm Terraform

📊 Data Streaming e Engineering
Kafka Spark GraphFrames NetworkX BigQuery Looker Studio SQL Pandas

🤖 Machine Learning
Scikit-Learn PyTorch TensorFlow NLTK

🛡️ SRE e Observability
Prometheus Grafana FastAPI

💻 Linguagens e Tools
Python Bash Git Linux VS Code


🏆 Certificações e Conquistas

☁️ Cloud & Data Engineering

Curso Emissor Conclusão
BigQuery for Data Analysts Google Cloud Fev 2025
Build and Deploy ML Solutions on Vertex AI Google Cloud Jan 2025
Hadoop Foundations - Level 1 IBM Dez 2024
Fundamentos de Eng. de Dados DSA Abr 2025

🧠 Data Science & BI

Curso Emissor Conclusão
Power BI para Business Intelligence DSA Set 2025
Machine Learning Operations (MLOps) Google Cloud Out 2024
Data Analytics SENAI Fev 2025

🎓 Acadêmico & Idiomas

Título / Grau Instituição Status
Cientista de Dados FATEC Em andamento
Engenharia Elétrica UNIMAR Concluído
Inglês Proficiente (C1) EF SET 63/100

📊 GitHub Stats

GitHub Streak

Contribution Graph


🌟 Open Source e Contribuições

Projeto Tipo Contribuição Status
Apache Kafka Issue Report Documentação de edge case em producers 🔄 Aberto
Strimzi Operator Discussion Boas práticas de tuning de performance ✅ Aceito
FastAPI Issue Report K8s deployment best practices 🔄 Em discussão

💡 Contribua comigo: Se você tem projetos open source relacionados a MLOps, Data Engineering ou SRE, adoraria colaborar!


📝 Artigos e Conteúdo Técnico

🚀 Em breve: Série de artigos técnicos sobre MLOps, SRE e Data Engineering

📌 Tópicos planejados:

  • Como Reduzir 40% do Custo de Infraestrutura com Kafka KRaft
  • MLOps na Prática: De Jupyter Notebook para GKE em 30 minutos
  • Graph Analytics em Escala: Apache Spark + GraphFrames para 100M+ Nós
  • Pandas UDF vs UDFs Tradicionais: Benchmark Real de Performance
  • Site Reliability Engineering para Pipelines de Dados
  • Arquitetura Híbrida: Do Desenvolvimento Local para GCP em 5 Minutos
  • Lei de Potência em Redes Sociais: Validação Científica com NetworkX

🤝 Vamos Construir Algo Juntos?

Estou aberto a:

🚀 Consultorias em MLOps e Cloud Architecture
💼 Oportunidades de colaboração em projetos desafiadores
🎤 Palestras técnicas sobre SRE e Data Engineering
🤝 Mentorias em Data Science e MLOps



Footer
⚡ Construído com dedicação por Alex Mendes | Última atualização: Dezembro 2025

Pinned Loading

  1. classificador-sentimentos-rnn classificador-sentimentos-rnn Public

    🤓 Classificador de Sentimentos de críticas de filmes (IMDb) utilizando Redes Neurais Recorrentes (RNN) com LSTM Bidirecional em TensorFlow. Demonstração completa de um pipeline de PLN.

    Jupyter Notebook

  2. projeto-previsao-clima projeto-previsao-clima Public

    🌦️ Previsão de temperatura utilizando PyTorch e Visão Computacional para analisar imagens de satélite. O projeto inclui um dashboard interativo com Streamlit.

    Python