Programa de Aceleração em Datascience. Aqui será reunido todos os desafios do programa.
- Pré-processamento de dados em Python
- Retirando dados Estatísticos do Dataset
- Funções de Probabilidade
- Teste Estatísticos
- Redução de dimensionalidade
- Feature Engineering
Você precisará de Python 3 e pip. É altamente recomendado utilizar ambientes virtuais com o virtualenv e o arquivo requirements.txt para instalar os pacotes dependências do desafio. Cada desafio tem um requirements específico.
Ambiente Linux
$ pip3 install virtualenv
$ virtualenv venv -p python3
$ source venv/bin/activate
$ pip install -r requirements.txt
Ambiente Windows
> pip3 install virtualenv
> virtualenv ..\venv -p python3
> ..\venv\Scripts\activate
> pip install -r requirements.txt
Quando finalizado, você pode desativar o ambiente virtual do virtualenv com:
$ deactivate