/MiningProject

Primary LanguageJupyter Notebook

MiningProject

Badge em Desenvolvimento

Este projeto está sendo desenvolvido para a matéria de Mineração de Dados. Consiste em escolher uma base de dados que possa ser aplicada algoritmos de classificação. Realizar processos de limpeza dos dados, bem como suas análises descritivas. Após realizadas as análises, é necessário aplicar diversos algoritmos de Machine Learning para obter a classificação dos dados.

A base de dados escolhida foi a census+income (base de dados de um censo dos Estados Unidos que armazena diversos dados de pessoas), esta base de dados está sendo utilizada para predizer se uma determinada pessoa receberá mais de U$ 50.000,00 (Cinquenta mil dólares) em um ano.

Podemos encontrar a base de dados aqui (adult.data):

Ou pelo site:

Objetivo: Como citado anteriormente, o projeto tem como objetivo realizar diversas etapas de mineração e ciência de dados, como realizar análises descritivas dos dados, limpeza, redução dos dados e por fim aplicar técnicas de Machine Learning.

Atividades:

  1. Entender quais informações o conjunto de dados possui;
  2. Analisar quais os tipos de dados;
  3. Verificar quais são as inconsistências nos dados;
  4. Realizar o Pré-Processamento dos dados;
  5. Realizar análise dos dados;
  6. Aplicar técnicas de visualização para melhorar o entendimento dos dados;
  7. Aplicar técnicas de Machine Learning;
  8. Analisar os resultados obtidos

Este projeto deverá ser apresentado como requisito final da matéria de Mineração de Texto para o curso de Engenharia de Computação