🚚 Automação de ETL para Logística com Python

📋 Resumo

Script ETL (Extract, Transform, Load) em Python que automatiza a limpeza de dados logísticos brutos (CSV) e exporta relatórios padronizados para Excel/BI, eliminando o trabalho manual de tratamento de planilhas.

💼 O Problema de Negócio

Na rotina de logística, é comum recebermos relatórios de transportadoras ou sistemas legados em formatos não padronizados (CSV "sujos"). Esses arquivos frequentemente apresentam:

Erros de codificação (caracteres estranhos como Ã£).
Colunas desformatadas (tudo na coluna A).
Datas misturadas (formatos PT-BR e EN-US) ou inválidas.
Inconsistências de digitação nos nomes das cidades.

O tratamento manual desses dados no Excel é demorado e sujeito a falhas humanas.

🎲 Simulação de Cenário (Data Mocking)

Por questões de confidencialidade e LGPD, não utilizei dados reais da empresa. Desenvolvi o script gerar_dados.py para criar uma massa de dados fictícia que simula os problemas reais enfrentados no dia a dia.

O que o gerador faz:

Cria um arquivo CSV propositalmente "sujo" (dados_logistica_brutos.csv).
Insere erros controlados para testar a robustez do script, como:
- Mistura de tipos de dados (texto em coluna numérica).
- Variações de input (ex: "sao paulo", "SÃO PAULO", "SP").
- Erros de separador CSV.

🛠 Como o Projeto foi Construído

O desenvolvimento seguiu um fluxo lógico de Engenharia de Dados:

Mapeamento: Identifiquei os padrões de erro nos relatórios recebidos.
Configuração do Ambiente: Utilizei o VS Code e criei um ambiente virtual Python, instalando as bibliotecas pandas (para análise) e openpyxl (para exportação Excel).
Engenharia do Caos: Criei o gerador de dados para replicar as falhas comuns em um ambiente controlado.
Pipeline ETL (etl_logistica.py):
- Extração: Leitura robusta com pandas, tratando erros de encoding UTF-8 e separadores.
- Transformação: Limpeza de strings (remoção de R$, kg), conversão de datas com tratamento de exceção (errors='coerce') e padronização de cidades via dicionário (De/Para).
- Carga: Exportação para .xlsx formatado utilizando a engine openpyxl.
Validação: Comparação do output final com os dados brutos para garantir integridade.

📂 Estrutura do Projeto

O repositório está organizado da seguinte forma:

📁 projeto-etl-logistica
│
├── 📄 etl_logistica.py            # Script principal (Lê o bruto -> Salva o limpo)
├── 📄 gerar_dados.py              # Script auxiliar (Gera o CSV com erros para teste)
├── 📄 dados_logistica_brutos.csv  # Arquivo de entrada (Input gerado)
└── 📊 tabela_logistica_limpa.xlsx # Arquivo final processado (Output)

🚀 Tecnologias Utilizadas

Python 3.x
Pandas (Manipulação e tratamento de dados)
OpenPyXL (Exportação para Excel)
VS Code (IDE)

📊 Resultados Visuais

Abaixo, a comparação entre o arquivo recebido (CSV Bruto) e o arquivo processado pelo script Python (Excel Limpo).

❌ Antes (CSV Sujo)	✅ Depois (Excel Limpo)
Dados desformatados, encoding quebrado e texto misturado.	Colunas separadas, datas corrigidas e cidades padronizadas.

Nota: As imagens acima demonstram o funcionamento do script rodando localmente.

⚙️ Como Rodar

Clone o repositório:

git clone (https://github.com/rhaycosta/Automacao-de-ETL-para-Logistica-com-Python)

Instale as dependências:
```
pip install pandas openpyxl
```
Gere os dados de teste:
```
python gerar_dados.py
```
Execute o ETL:
```
python etl_logistica.py
```
O arquivo tabela_logistica_limpa.xlsx será criado na pasta.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
dados_logistica_brutos.csv		dados_logistica_brutos.csv
etl_logistica.py		etl_logistica.py
gerador_dados.py		gerador_dados.py
planilha_antes_limpeza.png		planilha_antes_limpeza.png
planilha_depois_limpeza.png		planilha_depois_limpeza.png
tabela_logistica_limpa.xlsx		tabela_logistica_limpa.xlsx

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🚚 Automação de ETL para Logística com Python

📋 Resumo

💼 O Problema de Negócio

🎲 Simulação de Cenário (Data Mocking)

🛠 Como o Projeto foi Construído

📂 Estrutura do Projeto

🚀 Tecnologias Utilizadas

📊 Resultados Visuais

⚙️ Como Rodar

⚙️ Como Rodar

About

Uh oh!

Releases

Packages

Languages

rhaycosta/Automacao-de-ETL-para-Logistica-com-Python

Folders and files

Latest commit

History

Repository files navigation

🚚 Automação de ETL para Logística com Python

📋 Resumo

💼 O Problema de Negócio

🎲 Simulação de Cenário (Data Mocking)

🛠 Como o Projeto foi Construído

📂 Estrutura do Projeto

🚀 Tecnologias Utilizadas

📊 Resultados Visuais

⚙️ Como Rodar

⚙️ Como Rodar

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages