Ce package contient quelques livres de Jules Verne tels que distribués sur le Projet Gutenberg. Les livres sont encodés en UTF-8, préformattés et préparés pour des exercices de text mining utilisant la langue française. La structure est un data frame
de 2 colonnes:
text
: le texte du livre (une ligne contient environ 70 caractères),book
: le titre du livre correspondant (de typefactor
).
Les livres actuellement disponibles dans le package sont:
archipelenfeu
: L'archipel en feu (1884)autourdelalune
: Autour de la lune (1869)cinqsemaines
: Cinq semaines en ballon (1863)tourdumonde
: Le tour du monde en 80 jours (1872)souslesmers1
: Vingt-mille lieues sous les mers - première partie (1869)souslesmers2
: Vingt-mille lieues sous les mers - deuxième partie (1870)voyageterre
: Voyage au centre de la terre (1864)
Vous pouvez installer le package à partir de Github:
library(devtools)
devtools::install_github("mbio/julesverne")
library(julesverne)
La fonction principale du package retourne un data frame
de 2 colonnes contenant l'ensemble des livres disponibles:
verne()
La commande suivante permet d'afficher le nombre de lignes de chaque livre:
library(dplyr)
verne() %>%
group_by(book) %>%
summarise(nb_lignes = n())
On peut afficher la liste des livres comme suit:
levels(verne()$book)
Pour le contenu d'un livre en particulier, par exemple Cinq semaines en ballon
, entrez simplement cinqsemaines
(le nom de la variable). Ou assignez-la à une autre variable: livre1 <- cinqsemaines
. Le format retourné est une liste de caractères.
Pour une description de chaque livre, utilisez ?archipelenfeu
ou l'équivalent pour les autres titres. Utilisez ?verne
pour la description de la fonction.