Busca automatizada de produtos no site da OLX usando planilha para cadastro de produtos/filtros
- https://www.youtube.com/watch?v=bqVZsbjeJ2Y
- Execute o script
html_scraping.py
com o argumento --local, exemplo:python3 html_scraping.py --local
- Vídeo com passo a passo explicado: https://www.youtube.com/watch?v=1GIn0Y9jaws
-
No Google Cloud console, vai em
Menu
>APIs & Services
>Credentials
. ou entre direto no link: https://console.cloud.google.com/apis/credentials -
Clique em
Create Credentials
>OAuth client ID
. -
Clique em
Application type
>Desktop app
. -
No campo de nome, escreva um nome para a credencial. Este nome será mostrado somente no Google Cloud console.
-
Clique em
Create
. A tela de OAuth client criado aparecerá com seuClient ID
eClient secret
. -
Clique em OK. A nova credencial irá aparecer em OAuth 2.0 Client IDs.
-
Baixe o arquivo JSON e salve com nome
gsheet_credentials.json
na mesma pasta do projeto -
Crie uma planilha no Google sheets com as mesmas colunas da
/templates/busca.xlsx
com nome da página:busca
e preencha com os produtos e filtros desejados -
Execute o script
html_scraping.py
. Na primeira execução, será criado o arquivo/cred.json
-
Edite o arquivo
/cred.json
com as informações do e-mail e o id da planilha do Google Sheets. -
Pronto, agora, execute o script
html_scraping.py
com o argumento --gsheet ou sem argumento, exemplo:python3 html_scraping.py
- Será mostrado um log com os resultados da busca e será enviado, para cada produto, um e-mail para o destinatário cadastrado em
/cred.json
- Pode ser agendada uma tarefa no task scheduler (windows) ou crontab (linux) para automatizar as buscas
- Será mostrado um log com os resultados da busca e será enviado, para cada produto, um e-mail para o destinatário cadastrado em