Queries template

Esse é um template para um pacote DBT a ser importado no repositório principal, que irá gerar um servidor RPC para execução dos projetos.

Como usar esse template

Faça um fork desse repositório (docs).
Modifique o nome do repositório, caso deseje.
Configure os seguintes secrets no repositório:
- GKE_PROJECT: identificador do projeto no GCP.
- GKE_CLUSTER_NAME: nome do cluster no GKE.
- GKE_CLUSTER_ZONE: zona do cluster no GKE.
- GKE_SA_KEY: credenciais para uma conta de serviço com pleno acesso ao GKE, GCR e GCS. Preencher com o resultado de cat sua-credencial.json | base64.
Modifique o nome do pacote em dbt_project.yml para o nome do seu projeto. Aproveite esse momento para ler, com calma, os comentários desse arquivo de configuração.
Crie contas de serviço para seus projetos de desenvolvimento e produção. Caso tenha somente um projeto, pode usar a mesma conta para ambos os propósitos. Nota: Jamais faça commit de suas credenciais
Acesse o arquivo profiles.yml e se atente aos comentários, eles indicam os campos que devem ser alterados.
Usando os arquivos de credencial, crie os secrets credentials-dev e credentials-prod usando a flag --from-file.
Faça o upload das alterações realizadas em seu repositório.
Toda vez que houver uma alteração de código na branch main, uma instância atualizada do servidor RPC do DBT será criada em seu cluster, no devido namespace.

Resources:

Learn more about dbt in the docs
Check out Discourse for commonly asked questions and answers
Join the chat on Slack for live discussions and support
Find dbt events near you
Check out the blog for the latest news on dbt's development and best practices

Como desenvolver novos modelos

Caso seja um dataset-id já existente, acesse models/<dataset-id> e pule para o passo 5.
Caso seja um novo dataset-id, crie um novo diretório models/<dataset-id>.
No arquivo dbt_project.yml registre o dataset-id junto aos já existentes, conforme exemplo abaixo:

models:
  emd:
    dataset-id:
      +materialized: view # Materialization type (view, table or incremental)
      +schema: dataset-id # Overrides the default schema (defaults to what is set on profiles.yml)

No diretório models/<dataset-id>, crie um arquivo schema.yml para preencher metadados de suas tabelas. Exemplo abaixo:

version: 2

models:
  - name: my_first_dbt_model
    description: "A starter dbt model"
    columns:
      - name: id
        description: "The primary key for this table"

Desenvolva seus modelos (que corresponderão a tabelas) no diretório models/<dataset-id>.

basedosdados/queries-basedosdados

Queries template

Como usar esse template

Resources:

Como desenvolver novos modelos