/API-Aluguel-de-Bike

Consumo da API de Aluguel de Bicicleta

Primary LanguageJupyter Notebook

Desafio de Dados: Consumindo API de Aluguel de Bicicleta

Este repositório contém soluções para diversos problemas relacionados à obtenção e análise de dados de aluguel de bicicletas de uma API. As soluções são implementadas em Python e utilizam tabelas SQL para armazenar e apresentar os resultados.

Sumário

Descrição

Este repositório tem como objetivo resolver problemas relacionados ao consumo de dados de aluguel de bicicletas de uma API. As soluções são implementadas em PySpark e utilizam consultas SQL para armazenar e apresentar os resultados.

Problemas a serem resolvidos

  1. Obter a lista de todas as estações de bicicletas: É necessário obter e armazenar a lista de todas as estações de bicicletas em uma tabela SQL.

  2. Identificar a estação de bicicleta com a maior quantidade de bicicletas disponíveis em tempo real: Deve-se identificar a estação de bicicleta que possui a maior quantidade de bicicletas disponíveis em tempo real e exibir o resultado em uma tabela SQL.

  3. Calcular a média de duração de uma viagem em cada estação de bicicleta: É necessário calcular a média de duração de uma viagem em cada estação de bicicleta e apresentar os resultados em uma tabela SQL.

  4. Determinar a hora do dia com a maior e a menor quantidade de viagens: Deve-se determinar a hora do dia com a maior e a menor quantidade de viagens e apresentar os resultados em uma tabela SQL.

  5. Calcular a média de duração de uma viagem em cada hora do dia: É necessário calcular a média de duração de uma viagem em cada hora do dia e exibir os resultados em uma tabela SQL.

  6. Obter o histórico de viagens de uma estação de bicicleta específica: Deve ser possível obter o histórico de viagens de uma estação de bicicleta específica e exibir os resultados em uma tabela SQL.

  7. Identificar a estação de bicicleta mais popular com base no número total de viagens iniciadas: É importante identificar a estação de bicicleta mais popular com base no número total de viagens iniciadas e exibir o resultado em uma tabela SQL.

Soluções

As soluções para os problemas listados acima foram implementadas em PySpark e utilizam consultas SQL(queries.sql) para interagir com os dados.