Projeto para organização para o minicurso no IV SER
Nesse minicurso temos a intenção de abordar a integração entre o R e Python em um fluxo de análise rotineiro, vamos utilizar dos pacotes reticulate e feather para facilitar essa integração. Vamos mostrar uma análise descritiva em cima do conjunto de dados de e-commerce brasileiro, que pode ser encontrado no kaggle.
- Reticulate: O pacote permite reticular o código Python em R, criando um novo tipo de projeto que entrelaça os dois idiomas.
- O pacote reticulate fornece um conjunto de ferramentas para interoperabilidade entre o Python e o R.
- R Markdown, sourcing de scripts Python, importando módulos Python e usando Python interativamente dentro de uma sessão do R.
- Tradução entre objetos R e Python.
- Feather: A Fast On-Disk Format for Data Frames for R and Python
- Feather é um formato de arquivo binário rápido, leve e fácil de usar para armazenar dataframes.
- API leve e minimalista: tornar a entrada e saída de dataframes o mais simples possível
- Independentemente da linguagem: os arquivos do Feather são os mesmos, quer sejam escritos por código Python ou R. Outras linguagens podem ler e escrever arquivos Feather também.
- Alto desempenho de leitura e gravação. Quando possível, as operações de difusão devem estar vinculadas ao desempenho do disco local.
Os dados foram disponibilizados pelo olist, site que permite que pequenos e médios vendedores sejam colocados em alguns dos principais marketplaces brasileiros.
https://www.kaggle.com/olistbr/brazilian-ecommerce