Este é um projeto referente a conclusão do Módulo I do curso "Data Science na Prática", da plataforma sigmoidal.ai
Baseado no modelo criado pelo professor Carlos Melo, originalmente utilizando a cidade do Rio de Janeiro como exemplo, desenvolvi este pequeno projeto a partir dos dados da cidade de Chicago, a qual tenho muito apreço por ter morado lá no período de 2013 e 2014.
Se quiser conhecer mais sobre Chicago, popularmente chamada 'The Windy City', uma das maiores e mais incríveis cidades dos EUA, acesse o link Conheça Chicago em 5 dias e veja alguns de seus principais pontos turísticos.
Para analisar o Jupyter Notebook criado, basta ir à opção na parte superior deste repositório com o arquivo .ipynb
ou clicar aqui
Um dos resultados obtidos foram esses, que mostramos relações de preços por diárias, número mínimo de noites, número de reviews, etc.
Com os graficos abaixo podemos ver, por exemplo, que o preço das diárias em sua maioria, é inferior a 200 dólares, e que apenas uma parcela pequena de locais cobram mil dólares a noite. Da mesma forma, o número mínimo de noites de cada local a ser alugado em geral é de uma a cinco noites, o que é bastante adequado para pessoas que só querem passar um feriado pequeno na cidade, ou mesmo uma semana de férias.
Neste último gráfico temos uma visão de como se distribuem os preços das diárias de acordo com a localidade em Chicago. Confirmamos novamente que a maioria dos quartos ou apartamentos tem custo de até duzentos dólares por noite.
Conclusões
Este trabalho refere-se ao primeiro projeto realizado no curso 'Data Science na Pratica', e tem como um dos objetivos fornecer um primeiro contato com a análise de dados a partir de um dataset real. Mesmo com essa análise superficial, utilizando um dataset pequeno(o site Airbnb disponibiliza outros mais complexos e com muito mais dados, mas não eram adequados para este momento inicial), podemos perceber a exitência de outliers em algumas variáveis e como eles podem influenciar nos resultados. Vimos também que a análise não pode consistir somente da utilização dos métodos da linguagem Python, pois também é necessário interpretar os resultados a fim de extrair informações cada vez mais úteis e verossímeis.