Nesta análise irei lidar com uma seguradora fictícia que pretende elaborar produtos para o mercado imobiliário e para isso ela possui uma base de dados para ser trabalhada e desenvolver análises e relatórios.
- Foi solicitado pela empresa o primeiro relátorio com informações gerais sobre a Base de Dados.
- Foi solicitado pela empresa o segundo relátorio com Tipos de Imóveis.
- Foi solicitado pela empresa uma base de dados que contenha apenas Imóveis Residenciais.
- Com base no novo banco de dados, a seguradora deseja que realizemos algumas Seleções e retire a Frequência de cada uma delas.
- Selecionar somente os imóveis classificados com tipo 'Apartamento'.
- Selecionar os imóveis classificados com tipos 'Casa', 'Casa de Condomínio' e 'Casa de Vila'.
- Selecionar os imóveis com área entre 60 e 100 metros quadrados, incluindo os limites.
- Selecionar os imóveis que tenham pelo menos 4 quartos e aluguel menor que R$ 2.000,00.
- Identificamos alguns problemas que precisam ser solucionados, sendo eles os missings ou Tratamento de Dados Faltantes.
- Foi solicitado pela empresa a Criação de Novas Variáveis para o conjunto de dados.
- Variável que armazena o valor bruto do aluguel.
- Variável que armazena o valor com base no metrô quadrado de um imóvel.
- Variável de tipo que agregue casas e apartamentos.
- Obs.: Com base nas análises realizadas, expomos para a empresa que a variável 'Valor Bruto' possui valores pouco confiáveis, pois a variável IPTU nem sempre possui valores declarados. Sendo assim a empresa decidiu que 'Valor Bruto' e 'Valor Bruto m2' fossem excluídas do banco de dados.
- Com objetivo de continuar a verificação da base de dados a fim de encontrar problemas que possam prejudicar os resultados futuros, irei realizar análise de algumas estatísticas descritivas, sendo possível visualizar em Criando Agrupamentos.
- Após realizar a análise de algumas estatísticas descritivas, identificamos divergências nos dados e iremos removê-las, sendo possível visualizar em Identificando e Removendo Outliers.
Projeto realizado atráves da formação 'Python para Data Science', do curso 'Python Pandas: Tratando e analisando dados', da plataforma de aprendizagem 'Alura'.