Este pacote faz a tradução de conjuntos de dados em inglês originalmente disponíveis em outros pacotes de R. Os dados traduzidos são utilizados nos exemplos do livro R for Data Science de Hadley Wickham & Garrett Grolemund, cuja versão em português foi publicada por AltaBooks & O’Reilly.
O pacote dados
atualmente está em desenvolvimento. Esta versão (em
progresso) pode ser instalada a partir do GitHub:
# install.packages("remotes")
remotes::install_github("cienciadedatos/dados")
As traduções disponíveis dentro de dados
são as seguintes:
(NOTA: a medida que vamos traduzindo, os conjuntos de dados serão exibidos nesta tabela)
Nome | Título | Pacote | Dataset |
---|---|---|---|
diamante | Preço de 50.000 diamantes | ggplot2 | diamonds |
O pacote dados
pode ser carregado como qualquer outro pacote de R:
library(dados)
library(ggplot2)
library(dplyr)
Ao carregar o pacote, as variáveis que contêm os dados estarão
disponíveis imediatamente para uso. Porém, os dados não serão
traduzidos até que a variável seja “chamada” explicitamente por um
comando. Neste exemplo, o conjunto de dados diamante
, que provém de
ggplot2::diamonds
, é carregado no workspace do R no momento em que o
chamamos pela primeira vez em português:
glimpse(diamante)
#> Rows: 53,940
#> Columns: 10
#> $ preco <int> 326, 326, 327, 334, 335, 336, 336, 337, 337, 338, 339, …
#> $ quilate <dbl> 0.23, 0.21, 0.23, 0.29, 0.31, 0.24, 0.24, 0.26, 0.22, 0…
#> $ corte <ord> Ideal, Premium, Bom, Premium, Bom, Muito Bom, Muito Bom…
#> $ cor <ord> E, E, E, I, J, J, I, H, E, H, J, J, F, J, E, E, I, J, J…
#> $ transparencia <ord> SI2, SI1, VS1, VS2, SI2, VVS2, VVS1, SI1, VS2, VS1, SI1…
#> $ profundidade <dbl> 61.5, 59.8, 56.9, 62.4, 63.3, 62.8, 62.3, 61.9, 65.1, 5…
#> $ tabela <dbl> 55, 61, 65, 58, 58, 57, 57, 55, 61, 61, 55, 56, 61, 54,…
#> $ x <dbl> 3.95, 3.89, 4.05, 4.20, 4.34, 3.94, 3.95, 4.07, 3.87, 4…
#> $ y <dbl> 3.98, 3.84, 4.07, 4.23, 4.35, 3.96, 3.98, 4.11, 3.78, 4…
#> $ z <dbl> 2.43, 2.31, 2.31, 2.63, 2.75, 2.48, 2.47, 2.53, 2.49, 2…
Os dados traduzidos permanecerão carregados em sua sessão de R:
diamante %>%
filter(corte == "Bom") %>%
ggplot() +
geom_boxplot(aes(transparencia, preco, fill = transparencia)) +
theme(legend.position = "none") +
labs(title = "Diamantes", subtitle = "Preço e transparência", y = "Preço", x = "Transparência")
As funções internas de dados
foram desenvolvidas originalmente por seu
pacote irmão: datos