Spider Sintegra
Em um breve resumo, um spider é um sistema para captura de informações em sites da internet.
O spider sintegra tem o propósito de capturar informações sobre inscrições estaduais cadastrados no estado do Paraná.
Para rodar esse projeto em sua máquina, basta clonar este repositório da seguinte forma:
git clone https://github.com/Philipelima/spider-sintegra.git
Antes de rodar esse script, certifique-se que algumas extenções do php estejam habilitadas:
- curl
- iconv
- mbstring
Você pode verificar isso usando o seguinte comando no php CLI:
php -m
Caso elas não apareçam na listagem, basta habilita-las no arquivo php.ini.
Utilização do Spider
- No diretório do projeto, digite o seguinte comando:
php ./SpiderTest.php
Se toda configuração estiver okay, seguinte mensagem irá aparecer para você:
- Informe um CNPJ ou Inscrição Estadual da empresa que você deseja consultar (ela precisa estar cadastrado no sintegra do Paraná):
Por Inscrição Estadual:
O spider irá realizar o download do captcha solicitado pelo sintegra, e lhe mostrar logo em seguida
- Abra a imagem que se encontra no caminho mostrado a cima e digite o texto apresentado na imagem:
- Se tudo ocorrer bem, em sua tela aparecerá um array multidimensional com informações das inscrições estaduais do CNPJ pesquisado:
Erros
Se o captcha for digitado errado, a seguinte mensagem de erro aparecerá para você:
Caso o CNPJ digitado não for do estado do Paraná, após a resolução do captcha a seguinte mensagem de erro aparecerá para você: