resumosanpuh é uma interface de linha de comando (CLI) para raspar e organizar os resumos dos Simpósios Nacionais de História (ANPUH).
- Anos suportados: 2013, 2015, 2017, 2019, 2021*, 2023 e 2025
- Formatos de saída: CSV (padrão) e JSON
Aviso sobre 2021 O site do SNH 2021 encontra-se fora do ar. O CLI tenta acessar e, caso falhe, informa o problema e segue com os demais anos. Trata-se de uma indisponibilidade do site, não da ferramenta.
python3 -m venv .venv
source .venv/bin/activate # Linux/macOS
# .venv\Scripts\activate # Windows (PowerShell/CMD)Para sair do ambiente virtual depois:
deactivate
Dentro da pasta do repositório:
pip install -e .Isso instalará o CLI resumosanpuh e as dependências (BeautifulSoup, lxml, pandas etc.).
Depois de instalado, rode o comando passando os anos com -y/--years.
Você pode escolher o formato com -f/--format (csv ou json) e o nome do arquivo com -o/--output.
-y,--years(obrigatório): anos a raspar, por exemplo2013 2015 2017 2019 2021 2023 2025-o,--output: nome do arquivo de saída (padrão:<AAAA-MM-DD_HH-MM-SS>.csv)-f,--format:csv(padrão) oujson-v,--verbose: saída detalhada-q,--quiet: saída silenciosa
CSV (padrão):
resumosanpuh -y 2019 2023 2025 -o resumos_19-23-25.csvJSON:
resumosanpuh -y 2013 2015 2017 -f json -o resumos_13-15-17.jsonMisturando anos (com 2021):
resumosanpuh -y 2021 2023 2025 -o saida.csv -v
# Se 2021 estiver fora do ar, o CLI avisa e continua com 2023/2025.Se você omitir a extensão em
-o, ela é ajustada automaticamente com base em-f.
- O CLI tenta acessar o site do ano solicitado.
Em falha de rede/HTTP/timeout, registra a ocorrência em
ERROR_<data>.txt, mostra um aviso (a menos que--quiet) e continua com os demais anos. - 2021: como o site pode estar indisponível, a ferramenta tenta, avisa se não conseguir e pula este ano sem interromper a execução.
Cada registro possui:
Ano, Evento, Cidade, ST, Coordenadores, Autor(es)/Instituições, Título, Resumo
- CSV: abra em planilhas (LibreOffice/Excel) ou consuma com pandas/R.
- JSON:
orient='records', ideal para pipelines e integrações.
MIT. Contribuições (issues/PRs) são bem-vindas!