Bem vinda(o) ao Challenge Data Science 2 😊
Challenge Data Science 2
Tratamentos de dados, análises e modelos de machine learning com PySpark
🪧 Vitrine.Dev | Minha Vitrine |
---|---|
✨ Nome | Challenge Data Science 2 |
🏷️ Tecnologias | Pyspark, Data Science, Machine Learning, Storytelling |
🚀 URL | https://github.com/KaueAbbe/Challenge_Data_Science1_Alura |
🔥 Desafio | https://www.alura.com.br/challenges/data-science-2 |
Detalhes do projeto
Objetivo geral do Challenge: Utilizar Pyspark num contexto de Data Science 🤔
Eu faço parte do time de Ciência de Dados e Big Data da InsightPlaces e fiquei responsável por auxiliar no processo de análise de dados dos imóveis localizados em alguns bairros da cidade do Rio de Janeiro.
Esse projeto tem algumas etapas como: ler e fazer o tratamento do histórico dos preços de imóveis no Rio de Janeiro, construir um modelo de regressão para precificar imóveis e criar um recomendador de imóveis. Para cada uma dessas etapas vamos utilizar a ferramenta PySpark que oferece uma melhor performance ao trabalharmos com grandes volumes de dados.