Neste desafio vamos praticar redução de dimensionalidade com PCA e seleção de variáveis com RFE.
O objetivo deste desafio é explorar sobre como funciona o PCA e como podemos obter data sets de dimensões mais baixas através dele.
Para isso, vamos contar com o data set FIFA 2019 que contém originalmente 89 variáveis com diversos atributos de mais de 18 mil jogadores do game FIFA 2019.
Neste desafios nós vamos explorar:
- Redução de dimensionalidade
- PCA
- Seleção de variáveis
- RFE
Você precisará de Python 3 e pip. É altamente recomendado utilizar ambientes virtuais
com o virtualenv e o arquivo requirements.txt
para instalar os pacotes dependências
do desafio:
$ pip3 install virtualenv
$ virtualenv venv -p python3
$ source venv/bin/activate
$ pip install -r requirements.txt
Windows
> pip3 install virtualenv
> virtualenv ..\venv -p python3
> ..\venv\Scripts\activate
> pip install -r requirements.txt
Quando finalizado, você pode desativar o ambiente virtual do virtualenv com:
$ deactivate