/House-Rocket

Esse é um projeto de insights que busca auxiliar as tomadas de decisões da empresa House Rocket na compra e venda de imóveis.

Primary LanguageJupyter Notebook

House_Rocket_Logo

A House Rocket é uma empresa fictícia do ramo imobiliário que lucra a partir da compra e venda de imóveis, tendo como principal estratégia a compra de casas em boas condições por um baixo preço, as vendendo por um valor superior. Visando maximizar a eficiência na busca das melhores oportunidades de mercado e obter uma maior noção de qual preço aplicar em cima dos imóveis comprados, a empresa solicitou este projeto utilizando ferramentas de Ciência de Dados para gerar insights através da manipulação dos dados e consequentemente auxiliar as melhores decisões da equipe de negócios.

Questões de Negócio

  1. Quais são os imóveis que a House Rocket deveria comprar e por qual preço?
  2. Uma vez a casa comprada, qual o melhor momento para vendê-las e por qual preço?

Atributos

Os dados usados na elaboração desse projeto podem ser encontrados em: https://www.kaggle.com/harlfoxem/housesalesprediction/discussion/207885.

Abaixo segue a definição para cada um dos 21 atributos: Dicionario_Colunas

Premissas de Negócio

Para o desenvolvimento desse projeto, foram determinadas as seguintes premissas:

  1. Na coluna "yr_renovated", valores iguais a zero correspondem a imóveis que nunca passaram por reforma.
  2. Na coluna "waterfront", valores iguais a um correspondem a imóveis com vista para o mar, já valores iguais a zero correspondem a imóveis sem vista para o mar.
  3. A partir das análises, o imóvel com valor da coluna "bathroom" igual a 33 foi considerado como erro de digitação e em seguida removido.
  4. Para valores com ID duplicados, apenas o mais recente foi utilizado.

Planejamento da solução

Cronograma de estratégias para resolução do projeto:

  1. Entendimento de Negócio
  2. Definição das ferramentas e produto final
  3. Coleta de dados via Kaggle
  4. Limpeza dos dados
  5. Análise dos dados
  6. Criação de hipóteses
  7. Manipulação dos dados para testar hipóteses e gerar insights
  8. Resolver os problemas de negócio
  9. Desenvolver um Dashboard com os resultados obtidos
  10. Alocar esse produto final em um ambiente em nuvem

Ferramentas

Python 3.9.13

Streamlit

Amazon EC2

Manipulação de dados: pandas, numpy

Visualização de dados: seaborn, plotly, folium

Ambientes de desenvolvimento: VSCode, Jupyterlab

Principais insights

Durante o projeto, foram pensadas diversas hipóteses, algumas delas gerando interessantes insights de negócios, como:

Hipótese 1: Imóveis que possuem vista para água, são pelo menos 30% mais caros, na média.

  • Hipótese confirmada. Em média, o valor dos imóveis com vista para o mar são mais que 3x maiores aos imóveis sem esse privilégio.

Hipótese 2: Imóveis com data de construção menor que 1955, são 50% mais baratos, na média.

  • Hipótese falsa. A partir da invalidação dessa hipótese, deu pra chegar a conclusão que o preço médio das casas antigas é pouca coisa inferior ao preço médio das casas mais atuais.

Hipótese 7: Imóveis variam pelo menos 30% de média de preço por condição.

  • Hipótese falsa. Entretanto, foi possível constatar um aumento de 15% da média do preço da condição 4 para 5.

Hipótese 9: Imóveis com mais de 2 quartos são 70% mais caros que os que possuem apenas 1

  • Hipótese falsa. Além de identificar a magnitude da diferença do preço entre imóveis com 1 quarto para os demais, também se tornou possível perceber que a partir 9 quartos, existe uma queda significativa do preço médio.

Hipótese 10: Imóveis variam 4% ou mais o preço por nota de design, em média.

  • Hipótese verdadeira. Em média, imóveis variam 4% ou mais o preço por nota de design.

Resultado financeiro

Investimento total Retorno Lucro
$1.247.701.436 $1.535.581.285 $287.879.849

Conclusão

Foram calculadas as medianas do preço dos imóveis dentro de cada estação do ano por região. Todos os imóveis com o valor inferior a maior mediana de preço da sua região e com distancia de pelo menos 5% a ela foram indicados para compra. Para cada um desses imóveis selecionados foi sugerido o valor e melhor momento de venda, variando de acordo com sua região, condição e melhor mediana de preço por estação da sua região.

Caso a empresa consiga comprar e revender todos os 3282 imóveis pelos valores estipulados, a mesma terá um lucro de aproximadamente $287.879.849 (Sem levar em conta outros gastos da empresa durante esse período).

Próximos passos

Esse projeto desenvolvido com ferramentas da ciência de dados foi capaz de solucionar as questões de negócio, além de gerar insights para ajudar o departamento de negócios. Apesar disso, aqui estão algumas sugestões para a continuação e desenvolvimento do projeto:

  • Adicionar coloração por preço no mapa de exibição dos imóveis recomendados para compra.
  • Utilizar algoritmos de Machine Learning para chegar ainda mais próximo de um valor ideal para venda.
  • Separar o dashboard por páginas (Data Overview, Hipóteses, Questões de Negócio)
  • Criar novas hipóteses