Sucupira Scraper

Passo a passo:

  1. Acesse Catálogo de Teses e Dissertações da CAPES;
  2. Realize sua busca e aplique os filtros que precisar.
  3. Abra os registros de cada um dos registros que tem interesse, clicando em “Detalhes”.
  4. Copie o URL da Página “Dados do Trabalhos de Conclusão” de cada registro, e cole na caixa de “Raspagem dos dados…”. Recomendo antes fazer a lista em Planilha Google para melhor organização e backup.
  5. Use o limite de até 50 links (URLs) por vez. Caso seja preciso, repita a operação em lotes de até 50 URL.
  6. Clique em “Executar raspagem e gerar csv”.
  7. O arquivo poderá ser aberto e trabalhado em qualquer editor de planilhas ou Google Planilha.
    O sistema não funcionará se você copiar e colar diretamente o link do “Detalhes”. É preciso abrir o link “Detalhes” e copiar/colar o conteúdo do URL.
  8. Caso não tenha resultados consistentes, considere o aumentar o “Atraso entre requisições (ms)” e “Timeout (s)” e diminuir a quantidade de links.

Raspagem Sucupira (CAPES) — v3.2

Cole até 250 URLs do domínio sucupira-legado.capes.gov.br (uma por linha):

Atraso entre requisições (ms): intervalo em milissegundos entre cada página solicitada. Valores maiores deixam a coleta mais lenta, mas reduzem riscos de bloqueio pelo servidor. Valores muito baixos aceleram, porém podem causar erros 429/banimentos temporários. Timeout (s): tempo máximo de espera por resposta em cada requisição. Aumentar o timeout ajuda quando o portal está lento, mas a execução total leva mais tempo. Diminuir faz falhar mais rápido em conexões lentas.

Respeite os termos de uso do portal. Execuções muito grandes podem falhar por limite do servidor.