Neste repositório, irei compartilhar códigos referentes a Web Scraping, que tem como objetivo a extração de dados de páginas Web.
Existem diversas possibilidades para esse tipo de programação, podendo automatizar diversas tarefas em uma empresa.
Já utilizei softwares para criar rotinas de automação na web, além de utilizar extensões de navegadores para tarefas mais simples, mas pretendo aprender cada vez mais nesta área.
Links interessantes:
- PHP Web Scraping @lorien
- Web Scraping Console Tools @lorien
- Web Scraping Books @lorien
- Web Scraping Web Services @lorien
- Guia para iniciantes de Web Scraping em Python (usando BeautifulSoup)
- Youtube - Mini Curso Web Scraping com Python + BeautifulSoup + Requests
- Aprendendo sobre web scraping em Python utilizando BeautifulSoup
- Curso Pago - Web Scraping com Python e Beautiful Soup
- Livro Físico - Web Scraping Com Python: Coletando Dados na Web Moderna
- Apostila - Apostila Web Scraping com Python
- Web Scraping e Web Crawler – Introdução e Passos Iniciais
- Ebook Pago - Web Scraping for PHP developers
- Top 10 Best Web Scraping Books
- DataQuest - Cursos
- WebScraper IO
- Scrapy Python Primeiros Passos
- Scrapy
- Scrapy Tutorial
- Python - Preenchimento de Formulários
- PythonClub - Web Scraping na Nuvem
- Outro tutorial (em inglês) de scrapy
- Mais um tutorial de scrapy @speakerdeck
- scrapinghub scrapy cloud
- scrapy test @allanw
- scrapyd
- @sangaline - advanced web scraping tutorial
- Selenium
- Youtube - Python Web Scraping Tutorial 1 (Intro To Web Scraping)
- analystcave - web scraping tutorial
- stanford - Beautiful Soup
- Curso Udemy - Scrape Websites using PhantomJS and CasperJS
- Livro Online - Automate The Boring Stuff
- PhantomJs - Scriptable Headless WebKit
- puppeteer - Headless Chrome Node API
- CasperJS
- BeautifulSoup
- Python XML processing with lxml