scrappy: pdf scraper

Il suo obiettivo è estrae metadati e testo da un pdf dato in ingresso e di salvare il tutto in una cartella di destinazione.

Riconosce anche il linguaggio usato nella pagina e lo inserisce come metadato.

yoghi/scrappy