Il progetto nasce con l'itento di creare un Feed RSS di ogni articolo scritto da Carola Frediani, poichè il quotidiano La Stampa non permette di ricevere notifiche di nuove pubblicazioni o di effettuare ricerche su un singolo autore, limitando pertanto la possibilità di rimanere aggiornati sugli ottimi articoli scritti da Carola.
Successivamente il progetto si è amplicato creando generatori di Feed RSS anche per altri fonti che non prevedono automaticamente la geneazione di un Feed.
- È presente un cron che ogni 30 minuti analizza il Feed RSS e Homepage della La Stampa;
- Per ogni articolo pubblicato fa uno scrap del codice HTML alla ricerca del tag "article-author";
- Se il tag corrisponde con "carola frediani" o "frediani carola" viene aggiornato il Feed RSS in XML;
- Il Feed RSS dedicato a Carola conterrà, come da standard, l'ultimo articolo in cima. Vengono inoltre rimossi eventuali duplicati;
- Il Feed conterrà il Titolo, Link, Data (approssimativa) e Contenuto dell'articolo;
- Il contenuto viene reso "leggibile" con la libreria Readability e nel feed vengono riportati i soli primi 400 caratteri (HTML compreso, ovvero poco più di 100 caratteri di testo puro). Volutamente, per continuare la lettura si dovrà accedere al sito originale.
I Feed RSS generati sono disponibi su: https://rss.draghetti.it/
GNU General Public License version 2.0 (GPLv2)
- Andrea Draghetti is the creator of the project
Special thanks:
- Padraic Cunningham to support for coding.