Armazenamento "Glacier" no AWS

Introdução e método manual

Uma das formas mais econômicas de armazenar arquivos é usando o sistema GLACIER de armazenamento da AWS (https://aws.amazon.com/pt/glacier/), dado que os arquivos armazenados em dito sistema podem-se recuperar facilmente.

Para este fim foi construído inicialmente um sistema caraterziado por:

Processamentos de fluxos de dados em JSON:

Lembremos que a consulta desde a CLI é feito com os comandos JSON:

 aws glacier initiate-job --job-parameters '{"Type": "inventory-retrieval"}' --account-id YOUR_ACCOUNT_ID --region YOUR_REGION --vault-name YOUR_VAULT_NAME

Este procedimento de inventário demora aproximadamente 4 horas, e pode ser monitorado consultando a lista de trabalhos relacionada com dito VAULT:
```
 aws glacier list-jobs --account-id - --vault-name 2020_abril_06
```

Sendo possível esperar como resposta perante a consulta anterior:

 		{
 			"JobList": [
 				{
 					"InventoryRetrievalParameters": {
 						"Format": "JSON"
 					}, 
 					"VaultARN": "arn:aws:glacier:us-east-2:937852338641:vaults/2020_abril_06", 
 					"Completed": false, 
 					"JobId": "O0bmSJWCWIJOTojdj_BhQjbdN6jrQ1O-q3A6v79d5MI-2mHbl-1iTnZUk0vhrrL-R44A70KO3767Azzz9STA9mMknVuD", 
 					"Action": "InventoryRetrieval", 
 					"CreationDate": "2020-07-12T14:55:22.300Z", 
 					"StatusCode": "InProgress"
 				}
 			]
 		}

Se a resposta for do tipo:

 {
 	"JobList": [
 		{
 			"CompletionDate": "2020-07-12T18:40:02.958Z", 
 			"VaultARN": "arn:aws:glacier:us-east-2:937852338641:vaults/2020_abril_06", 
 			"InventoryRetrievalParameters": {
 				"Format": "JSON"
 			}, 
 			"Completed": true, 
 			"InventorySizeInBytes": 34120, 
 			"JobId": "O0bmSJWCWIJOTojdj_BhQjbdN6jrQ1O-q3A6v79d5MI-2mHbl-1iTnZUk0vhrrL-R44A70KO3767Azzz9STA9mMknVuD", 
 			"Action": "InventoryRetrieval", 
 			"CreationDate": "2020-07-12T14:55:22.300Z", 
 			"StatusMessage": "Succeeded", 
 			"StatusCode": "Succeeded"
 		}
 	]
 }

Estariamos perando um cenário de "trabalho pronto" ("StatusCode": "Succeeded")

Já com este ("StatusCode": "Succeeded") pode-se coletar o inventário do VAULT usando:
```
 aws glacier get-job-output --account-id - --vault-name 2020_abril_06 --job-id  O0bmSJWCWIJOTojdj_BhQjbdN6jrQ1O-q3A6v79d5MI-2mHbl-1iTnZUk0vhrrL-R44A70KO3767Azzz9STA9mMknVuD inventario_JSON.txt
```
Obte-se desta linha de comando o arquivo "inventario_JSON.txt" que pode ser estudado com ajuda dos arquivos:
- ler_inventario_SAIDA_ArchiveId.py (Pare gerar uma lista de ArchiveID)
- ler_inventario_SAIDA_DATA.py (Para ver a data de criação de cada elemento)
Pode-se criar uma lista de ArchiveID com ajuda do "ler_inventario_SAIDA_ArchiveId.py" e assim poder criar os JOBs de recuperação de dito arquivo (identificado com o ArchiveID) em cada vault usando o comando CLI:
```
 aws glacier initiate-job --account-id - --vault-name 2020_abril_06  --job-parameters '{"Type": "archive-retrieval","ArchiveId": "'$line'","Description": "'$lista' '$indice'"}'
```
Com o intuito de fazer este pedido de "archive-retrieval" de forma massiva foi feito um shell chamdado de "processar.sh" que tem a capacidade de pegar os arquivos da pasta "fazer" para ler o conteúdo de cada arquivo (de nome "x*") e posteriormente colocar dito arquivo na pasta "feitos".
Etapa final na qual se gera uma arquivo único com ajuda do arquivo "get_ARQUIVOS.py" prévia execução do comando:
```
 aws glacier list-jobs --account-id - --vault-name 2020_abril_06	 > testar	
```
Cabe salientar que será preciso invocar o python na forma:
```
 python get_ARQUIVOS.py
```

Como detalhe final é preciso considerar a forma de apagar cada arquivo no VALUT (neste exemplo o VAULT é chamado de 2020_abril_06) isto com ajuda da instrução CLI

aws glacier delete-archive --account-id - --vault-name 2020_abril_06 --archive-id

Com o intuito de automatizar dita tarefa pode-se ler o inventáio (inventario_JSON.txt) com ajudad do shell gerar_delete.sh

Ve-se que este processamento manual pode-se transformar numa "Máquina de Estado" com ajuda da plataforma STEP AWS.

Usando SNS, STEP, e lambda functions:

Para saber mais:

https://d12tkzd8xe838o.cloudfront.net/us-east-2:d81cf72b-c77f-4a8f-987c-0e7207a1469a/EP14-TrilhaTecnica-Storage.mp3

Não se esqueça de usar o CACHE das credenciais para agilizar as operações

git config --global credential.helper cache
git config --global credential.helper 'cache --timeout=13600'

julian-gamboa-bahia/aws_step_glacier

Armazenamento "Glacier" no AWS

Introdução e método manual

Usando SNS, STEP, e lambda functions:

Para saber mais: