/Baby_Spider

Desenvolvimento de Crawler para a aula de Calculo Computacional e Estatística.

Primary LanguagePythonCreative Commons Zero v1.0 UniversalCC0-1.0

BABY SPIDER 🕷️🕸️
Em Desenvolvimento 🚧

Crawler em formato de utilitário de linha de comando para extrair dados de forma mais rápida e simples.

Modo de usar

Antes de tudo, de uma olhada no help:

python spider.py -h

Se você tiver o link de download de um CSV por exemplo, dentro do repositório Baby_Spider, faça:

python spider.py --url "https://exemplo.com/arquivo.csv" -e csv

Se o arquivo for um JSON ou qualquer outro formato, substitua o valor do parametro -e

python spider.py --url "https://exemplo.com/arquivo.json" -e json

e se quiser criar um script importando esse arquivo, adicione o --r-script para gerar automaticamente:

python spider.py --url "https://exemplo.com/arquivo.csv" -e csv --r-script

Caso você tem o link de um ZIP, faça o seguinte comando:

python spider.py --url "https://exemplo.com/pacote.zip" -z

Se quiser extrair todo o conteúdo desse pacote zip, adicione o parametro --zip-all

python spider.py --url "https://exemplo.com/pacote.zip" -z --zip-all

"Instalação"

  1. Clone o projeto
git clone https://github.com/FelipeSantos-cco/Baby_Spider.git
  1. Entre no repositório que foi clonado
cd Baby_Spider
  1. Instale as dependencias do projeto
pip install -r requirements.txt

Desenvolvimento em:

Python


Caso queira contribuiur ao projeto, faça um fork que ficarei extremamente feliz ❤️😄