Bem vinda(o) ao Challenge Data Science 2 😊

Challenge Data Science 2

Tratamentos de dados, análises e modelos de machine learning com PySpark

🪧 Vitrine.Dev Minha Vitrine
✨ Nome Challenge Data Science 2
🏷️ Tecnologias Pyspark, Data Science, Machine Learning, Storytelling
🚀 URL https://github.com/KaueAbbe/Challenge_Data_Science1_Alura
🔥 Desafio https://www.alura.com.br/challenges/data-science-2

Detalhes do projeto

Badge em Desenvolvimento

Objetivo geral do Challenge: Utilizar Pyspark num contexto de Data Science 🤔

Eu faço parte do time de Ciência de Dados e Big Data da InsightPlaces e fiquei responsável por auxiliar no processo de análise de dados dos imóveis localizados em alguns bairros da cidade do Rio de Janeiro.

Esse projeto tem algumas etapas como: ler e fazer o tratamento do histórico dos preços de imóveis no Rio de Janeiro, construir um modelo de regressão para precificar imóveis e criar um recomendador de imóveis. Para cada uma dessas etapas vamos utilizar a ferramenta PySpark que oferece uma melhor performance ao trabalharmos com grandes volumes de dados.

Quais bibliotecas encontrarei nos notebooks?

1. Para ler e tratar dados: Pyspark

Detalhes de Arquivos:

Badge em Desenvolvimento

Autor

🚀

Feito com 💙 por Kaue Hermann Abbehausen 👋🏽
Formado em Física na Universidade Federal de Uberlândia, mestrando em física estatísitica pela Universidade de Brasília e estudante de Data Science

Entre em contato por