Petite pipeline pour avoir la proportion des genres des personnes apparaissant dans le rubrique disparitions de lemonde.fr.
Pour l'instant, l'encodage est fait manuellement mais j'ai bien l'idée de faire une extraction d'entité nommée à pas cher et un peu de machine learning pour identifier les genres.
https://observablehq.com/@taniki/lemondefr-parite-disparitions
Archive quotidienne du RSS de la catégorie sous forme de fichiers csv
.
Liste dédupliquée des articles archivées.
Liste dédupliquée des personnes identifiées.