Este repositório contém soluções para diversos problemas relacionados à obtenção e análise de dados de aluguel de bicicletas de uma API. As soluções são implementadas em Python e utilizam tabelas SQL para armazenar e apresentar os resultados.
Este repositório tem como objetivo resolver problemas relacionados ao consumo de dados de aluguel de bicicletas de uma API. As soluções são implementadas em PySpark e utilizam consultas SQL para armazenar e apresentar os resultados.
-
Obter a lista de todas as estações de bicicletas: É necessário obter e armazenar a lista de todas as estações de bicicletas em uma tabela SQL.
-
Identificar a estação de bicicleta com a maior quantidade de bicicletas disponíveis em tempo real: Deve-se identificar a estação de bicicleta que possui a maior quantidade de bicicletas disponíveis em tempo real e exibir o resultado em uma tabela SQL.
-
Calcular a média de duração de uma viagem em cada estação de bicicleta: É necessário calcular a média de duração de uma viagem em cada estação de bicicleta e apresentar os resultados em uma tabela SQL.
-
Determinar a hora do dia com a maior e a menor quantidade de viagens: Deve-se determinar a hora do dia com a maior e a menor quantidade de viagens e apresentar os resultados em uma tabela SQL.
-
Calcular a média de duração de uma viagem em cada hora do dia: É necessário calcular a média de duração de uma viagem em cada hora do dia e exibir os resultados em uma tabela SQL.
-
Obter o histórico de viagens de uma estação de bicicleta específica: Deve ser possível obter o histórico de viagens de uma estação de bicicleta específica e exibir os resultados em uma tabela SQL.
-
Identificar a estação de bicicleta mais popular com base no número total de viagens iniciadas: É importante identificar a estação de bicicleta mais popular com base no número total de viagens iniciadas e exibir o resultado em uma tabela SQL.
As soluções para os problemas listados acima foram implementadas em PySpark e utilizam consultas SQL(queries.sql
)
para interagir com os dados.