Data Lake Música

Descrição :

Este projeto trás uma estrutura básica de um data lake que armazenará dados de audios vindos do soundcloud.

Estrutura do Lago

  • Landed : arquivos brutos, que acabaram de chegar;
  • Raw : Arquivos otimizados, já em um formato mais estruturado;
  • Modeled : Arquivo com agregações, joined e etc;
  • Self : Arquivos pronto para uso

Ambiente:

Leituras Importantes:

Comandos

Quem usa pip

  • sudo pip install virtualenv (instalar virtualenv)
  • Na pasta do projeto, virtualenv .venv
  • source .venv/bin/activate (Ativar ambiente virtual)
  • pip install -r requirements.txt
  • jupyter notebook

Quem usa pipenv

  • sudo pip install pipenv
  • na pasta do projeto pipenv shell
  • pipenv install
  • jupyter notebook