Serviços utilizados
Amazon S3
Amazon Glue
Amazon Athena
Amazon QuickSight
Etapas para desenvolvimento Criar bucket no Amazon S3
Amazon S3 Console -> Buckets -> Create bucket -> Bucket name [nome_do bucket] - Create bucket
Create folder (Criar uma pasta chamada /output e outra com o nome do seu conjunto de dados. Este nome irá definir o nome da tabela criada no Glue)
Upload dos arquivos de dados localizados na pasta /data
Criar Glue Crawler
Amazon Glue Console -> Crawlers -> Add Crawler
Source type [Data Stores] -> Crawl all folders
Data store [S3] -> Include path [caminho do diretório dos dados de entrada]
Create IAM Role
Frequency [Run on demand]
Database name [seu_nome_de_db]
Group behavior [Create a single schema for each S3 path]
Finish
Databases -> Tables -> Visualizar dados das tabelas criadas
Criar aplicação no Amazon Athena
Query editor -> Settings -> Manage settings -> Query result location and encryption -> Browse S3 -> selecionar o bucket criado
Selecionar Database -> criar queries (exemplos na pasta /src)
Verificar queries não salvas no bucket criado no S3
Salavar queries -> Executar novamente -> Verificar no bucket criado no S3
Criando nova tabela
Generate table DDL
Copiar a query gerada
Selecionar o DB e criar a nova tabela em uma nova query
Visualizar dados no Amazon QuickSight
Signup (caso não tenha conta) -> Escolher [Standard]
Datasets -> Create new dataset -> Athena -> Name [NomeDoDataSet] -> Create
Select database -> select table -> Edit or preview -> Save & visualize
Criar visualizações selecionando colunas, criando filtros e parâmetros e selecionando Visual types para gráficos.