Diretório criado para os arquivos do curso Machine Learning em Python com Scikit-learn , do professor Ivan Lourenço Gomes, na Udemy.
O aprendizado foi todo baseado na linguagem python e utilizei o Google Colab para realizar esse treinemento. Por tanto os arquivos estão na extenção Jupyter notebook files.
- Primeiro módulo - modulo_classificacao_com_iris_dataset
Nesse módulo aprendemos a usar machine learning para classificação, com sklearn. Como dataset, utilizamos o Iris Dataset. Aprendemos a utilizar o modelo KNN (K nearest neighbor), para gerar uma previsão e o módulo metrics para avaliar nossa precisão.
Por fim, também aprendemos a utilizar o modelo de regressão logistica, onde foi utilizada a técnica a one vs all, para realizar a previsão.
Como complemento, foi proposto um exercício onde o desafio foi alterar o do modelo KNN, de 1 a 25, para alterar a quantidade de neibors usadas por amostra. Como resulação, utilizei a estrutura de repetição while.
- Segundo módulo - modulo_regressao No segundo módulo aprendemos a utilizar o modelo de regressão linear por meio do sklearn.linear_model. Nos foi fornecido um dataset contendo informações de invenstimentos em propagandas por meio de rádio, tv e jornal e as respectivas taxas de vendas. Por meio de um gráfico do pacote seaborn, pudemos ver que existe sim uma correlação positiva entre o investimento em propagandas e as vendas
Após apresentar treinar nossa máquina utilizando LinearRegression e reglin.fit, pudemos ver que os inserções se aproximaram da realizade.
Ainda, para avaliar a performance, utilizamos método RMSE (root mean squared error) mostrou melhor precisão.
Por fim foi proposto um exercício onde o objetivo era remover as variáveis uma a uma e observar se havia influência na precisão do modelo. Ao finalizar o exercício, foi observado que quando removida a variável "Jornal", o modelo apresentava maior precisão.
- Terceiro módulo - modulo_reconhecimento_imagem_digits_dataset
Nesse módulo aprendemos a utilizar o sklearn para o reconhecimento de imagens. Utilizamos o datasets como base e o módulo SVM (support vector machine) para trienar nossa máquina. Por fim, o resultado foi um modelo capaz de reconhecer corretamente o número apresentado.