- Repositório com material para curso de Ciência de Dados.
- Slides (em breve?).
- Spark
- Elasticsearch
- MongoDB
- Numpy - biblioteca para operações em arrays multidimensionais.
- Scipy - biblitoeca para operações em computação científica.
- Pandas - biblioteca para uso em estruturas de dados e análise eficiente de dados.
- Matplotlib - biblioteca para criação e visualização de gráficos.
- Seaborn - biblitoeca para visualização de dados (utiliza o matplotlib como base).
- Plotly - biblioteca para criação e visualização de gráficos.
- Scikit-Learn
- Jupyter
- Google Colaboratory
- Kaggle
- Análise de fraudes em cartão de crédito
- TMDB 5000 movie dataset
- Bitcoin historical data
- Yelp dataset
- Netflix prize data
- Github data
- Stackoverflow data
- Open images dataset