Lista de filmes extraido do site Agência Nacional do Cinema
https://www.ancine.gov.br/pt-br/brasil-nas-telas
title
sinopse
produção
genero
data de lancamento
image
https://github.com/eltonjncorreia/ancine_scrapy/blob/master/brasil_scrapy/ancine.csv
Python 3, Scrapy 1.5, Pymongo 3.4
é recomendado usar um ambiente virtual, porém é possivel ignorar os passos se voçê já souber o que está fazendo.
git clone https://github.com/eltonjncorreia/ancine_scrapy.git
cd ancine_scrapy
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
cd brasil_scrapy
Este crawler armazena os dados no Mongodb Atlas - https://cloud.mongodb.com/
scrapy crawl ancine
Executar o crawler e armazenar os dados em arquivos tipo :"file.txt" troque "file.txt" pelo nome de sua preferência.
scrapy crawl ancine -o file.txt