/datasets

Repo avec la liste des datasets auxquels nous avons accès

datasets

Repo avec la liste des datasets auxquels nous avons accès.

Nom Langue Description Taille Format Partageable ? Qui
European Commission Archives Langues EU Archives 160 Go PDF Team STIC only Simon
AMSAB NL Journaux 173 Go .xml, .txt, .pdf Non Simon
Wikipedia-FR FR Tout 4.4 Go .txt tout le monde Simon
Wikipedia-FR-en FR Articles ayant équivalent EN 3.1 Go .txt tout le monde Simon
Wikipedia-EN EN Tout 15 Go .txt tout le monde Simon
Wikipedia-EN-fr EN Articles ayant équivalent FR 4.9 Go .txt tout le monde Simon
Gutenberg EN 9000 premiers livres EN 5.4 Go .txt tout le monde Simon
whois EN Toutes entrées pour .brussels 8.4 Mo .txt STIC only Simon
Ypres NL-FR-EN Archives de la ville d'Ypres 1815-1970 3.2 Go XML STIC only Max