Projeto aberto para baixar, processar e publicar dados públicos das empresas do Brasil.
ETL
: ETL que baixa, processa e publica dados do CNPJ.Page
: página/SPA estática para consulta dos dados publicados.
.NET SDK 9.0+
rclone
instalado e autenticado no seu storage (ex.: Backblaze, R2, S3, Azure Storage, ...).- Espaço em disco e boa conexão (a primeira execução pode levar tempo -- dias até).
- Ajuste
ETL/config.json
se desejar mudar pastas locais, destino do storage, memória, paralelismo... - No
config.json
, aponte para o Storage que deseja passando a configuração do rclone.
- Dentro de
ETL
:dotnet run pipeline
dotnet run pipeline -m YYYY-MM
(opcional)
Outros comandos úteis (opcionais):
dotnet run zip
: gera um ZIP consolidado local.dotnet run test
: roda teste simples de integridade.dotnet run single --cnpj 00000000000191
: processa um CNPJ específico.
- Abra issues para discutir mudanças.
- Faça fork, crie uma branch descritiva e envie PR.
- Mantenha commits pequenos e o projeto compilando (
dotnet build
).