Este projeto é um Web Crawler desenvolvido para coletar dados do site da Agência Nacional de Saúde (ANS) relacionados à documentação do padrão TISS (Troca de Informações na Saúde Suplementar), histórico de versões dos componentes TISS e tabelas relacionadas. O objetivo é automatizar a tarefa de baixar documentos e coletar informações relevantes dessas páginas.
- O bot deve acessar o site utilizando os recursos aprendidos no Nível ZG, no caso, a HTTPBuilder.
- Acessar o site da ANS.
- Acessar o campo "Espaço do Prestador de Serviços de Saúde".
- Acessar o campo "TISS - Padrão para Troca de Informação de Saúde Suplementar".
- Acessar o campo "Padrão TISS Versão Mês/Ano".
- Realizar o parser no HTML de modo a obter os elementos da tabela de documentos.
- Baixar o arquivo de Componente de Comunicação, na tabela de arquivos do padrão TISS, e salvar em uma pasta de Downloads no mesmo diretório do projeto (exemplo: "./Downloads/Arquivos_padrao_TISS").
- Acessar o site da ANS.
- Acessar o campo "Histórico das versões dos Componentes do Padrão TISS".
- Coletar, na tabela, os dados de competência, publicação e início de vigência a partir da competência de data jan/2016.
- Armazenar os dados coletados em um arquivo de texto, por exemplo, "Historico.txt".
- Acessar o site da ANS.
- Acessar o campo "Tabelas relacionadas".
- Baixar a "Tabela de erros no envio para a ANS" (arquivo .xlsx).
- Salvar o arquivo em uma pasta de Downloads no mesmo diretório do projeto (exemplo: "./Downloads/Arquivos_Relacionados").
- Linguagem: Groovy
- Ferramenta de Build: Gradle
- Bibliotecas:
- HTTPBuilder NG (https://http-builder-ng.github.io/http-builder-ng/)
- Jsoup (https://jsoup.org/)
Se você quiser contribuir para o projeto, fique à vontade para abrir um pull request. Qualquer ajuda é bem-vinda!