Spider Sintegra

PHP CURL

Em um breve resumo, um spider é um sistema para captura de informações em sites da internet.

O spider sintegra tem o propósito de capturar informações sobre inscrições estaduais cadastrados no estado do Paraná.

Para rodar esse projeto em sua máquina, basta clonar este repositório da seguinte forma:

    git clone https://github.com/Philipelima/spider-sintegra.git

Antes de rodar esse script, certifique-se que algumas extenções do php estejam habilitadas:

  • curl
  • iconv
  • mbstring

Você pode verificar isso usando o seguinte comando no php CLI:

    php -m

Caso elas não apareçam na listagem, basta habilita-las no arquivo php.ini.

Utilização do Spider

  1. No diretório do projeto, digite o seguinte comando:
    php ./SpiderTest.php

Se toda configuração estiver okay, seguinte mensagem irá aparecer para você:

Digite o cnpj


  1. Informe um CNPJ ou Inscrição Estadual da empresa que você deseja consultar (ela precisa estar cadastrado no sintegra do Paraná):
Por CNPJ:

Digite o cnpj


Por Inscrição Estadual:

Digite o cnpj


O spider irá realizar o download do captcha solicitado pelo sintegra, e lhe mostrar logo em seguida

Digite o cnpj


  1. Abra a imagem que se encontra no caminho mostrado a cima e digite o texto apresentado na imagem:

Digite o cnpj

  1. Se tudo ocorrer bem, em sua tela aparecerá um array multidimensional com informações das inscrições estaduais do CNPJ pesquisado:

Digite o cnpj



Erros

Se o captcha for digitado errado, a seguinte mensagem de erro aparecerá para você:

Digite o cnpj



Caso o CNPJ digitado não for do estado do Paraná, após a resolução do captcha a seguinte mensagem de erro aparecerá para você:

Digite o cnpj