Workshop

Preparação do Ambiente
Sobre o PostgreSQL
SQL
Tipos de Dados
DDL
DML
Chave Estrangeira
Subqueries
CTE
Junções
Indexação
Range Types
DOMAIN
Acessando o Postgres via Python (psycopg2)
PL/Python: Programando em Python no PostgreSQL

Preparação do Ambiente

Baixar / Instalar

VirtualBox

Criar Interface de Rede Host-Only:

File → Preferences → Network → Host-only Networks → + → OK

Importar a Imagem Appliance:

File → Import Appliance... → (localize o arquivo .ova) → Next → Import

Sobre o PostgreSQL

to do... ;)

SQL

Structured Query Language – Linguagem Estruturada de Consulta, é a linguagem usada nos SGBDs relacionais por padrão, no entanto cada um tem suas particularidades dentro da própria linguagem, tendo implementações diferentes.
O mesmo objetivo pode ser feito de formas SQL diferentes de um SGBD pra outro.
Assim como em linguagens de programação “comuns”, existem palavras reservadas, as quais não podem ser usadas como identificadores.
Cada comando SQL é finalizado com ponto e vírgula (;).

Um SELECT simples retornando uma string:

SELECT 'Um exemplo de string';

       ?column?       
----------------------
 Um exemplo de string

Um SELECT simples com alias retornando uma string:

SELECT 'Um exemplo de string' AS apelido;

       apelido        
----------------------
 Um exemplo de string

Um SELECT simples com alias contendo espaços retornando uma string:

SELECT 'Um exemplo de string' AS "apelido com espaço";

  apelido com espaço  
----------------------
 Um exemplo de string

Soma de dois números:

SELECT 5 + 2;

 ?column?
----------
        7

Soma de dois números e alias:

SELECT 5 + 2 AS resultado;

 resultado
-----------
         7

Concatenação e conversão para data:

SELECT 'Hoje é ' || now()::date AS "Concatenação e cast para date";

 Concatenação e cast para date
-------------------------------
 Hoje é 2017-07-05

Concatenação e conversão para hora:

SELECT 'Agora são ' || now()::time(0) AS "Concatenação e cast para time";

 Concatenação e cast para time
-------------------------------
 Agora são 14:16:21

Tipos de Dados

O PostgreSQL tem vários tipos de dados.
Cada atributo de uma entidade tem um tipo mais adequado.

Além dos tipos de dados variados é interessante conhecer também máscaras de dados.

Tipo inteiro padrão (int4; 4 bytes):

SELECT pg_typeof(7);

 pg_typeof
-----------
 integer

Tipo inteiro de 2 bytes:

SELECT pg_typeof(7::int2);

 pg_typeof
-----------
 smallint

Tipo inteiro de 8 bytes:

SELECT pg_typeof(7::int8);

 pg_typeof
-----------
 bigint

Tipo desconhecido de string:

SELECT pg_typeof('foo');

 pg_typeof
-----------
 unknown

Tipo de string VARCHAR:

SELECT pg_typeof('foo'::varchar);

     pg_typeof     
-------------------
 character varying

Tipo de string TEXT:

SELECT pg_typeof('foo'::text);

 pg_typeof
-----------
 text

Tipo para endereço IP:

SELECT '192.168.0.1'::inet;

    inet     
-------------
 192.168.0.1

E se for colocado um IP inválido?:

SELECT '192.168.0.256'::inet;

ERROR:  invalid input syntax for type inet: "192.168.0.256"
LINE 1: SELECT '192.168.0.256'::inet;
               ^

Endereço MAC:

SELECT '00:01:07:f4:cb:55'::macaddr;

      macaddr      
-------------------
 00:01:07:f4:cb:55

Endereço CIDR:

SELECT '192.168/25'::cidr;

      cidr      
----------------
 192.168.0.0/25

Validação IPv6:

SELECT 'fe80::f67e:5b4f:d208:713a/64'::inet;

             inet             
------------------------------
 fe80::f67e:5b4f:d208:713a/64

Tamanho de um endereço de rede como texto:

SELECT pg_column_size('fe80::f67e:5b4f:d208:713a/64'::text);

 pg_column_size
----------------
             32

Tamanho de um endereço de rede como inet:

SELECT pg_column_size('fe80::f67e:5b4f:d208:713a/64'::inet);

 pg_column_size
----------------
             22

Máscara para CPF:

SELECT to_char(39684721495, '000"."000"."000-00') AS cpf;

       cpf       
-----------------
  396.847.214-95

Na máscara foi utilizado zeros para CPFs que têm zeros à esquerda.

Converter para algarismos romanos:

SELECT to_char(2017, 'RN');

     to_char     
-----------------
          MMXVII

Número com 7 dígitos, 2 são para casas decimais:

SELECT 10500::numeric(7, 2);

 numeric  
----------
 10500.00

DDL

Data Definition Language é uma subdivisão de SQL que trata da manipulação de objetos do banco de dados.
Seus principais comandos são:

CREATE (criação);
DROP (remoção);
ALTER (alteração).

Alguns tipos de objetos de bancos de dados: DATABASE, SCHEMA, TABLE, VIEW, SEQUENCE, TRIGGER, etc...

Criação de uma nova base de dados:

CREATE DATABASE db_workshop;

Usar o meta-comando \c do cliente psql para se conectar à nova base de dados:

\c db_workshop

Função que retorna a base de dados atual:

SELECT current_database();

 current_database
------------------
 db_workshop

Função que retorna o usuário atual:

SELECT current_user;

 current_user
--------------
 postgres

Criação de uma nova tabela:

CREATE TABLE tb_produto(
    id serial PRIMARY KEY,
    nome varchar(50) NOT NULL,
    preco numeric(7, 2) NOT NULL,
    descricao text);

Verificar a estrutura da tabela:

\d tb_produto

                                  Table "public.tb_produto"
  Column   |         Type          |                        Modifiers                        
-----------+-----------------------+---------------------------------------------------------
 id        | integer               | not null default nextval('tb_produto_id_seq'::regclass)
 nome      | character varying(50) | not null
 preco     | numeric(7,2)          | not null
 descricao | text                  |
Indexes:
    "tb_produto_pkey" PRIMARY KEY, btree (id)

Alterar a tabela adicionando um novo campo:

ALTER TABLE tb_produto ADD COLUMN campo_inteiro INT;

Alterar o nome da tabela:

ALTER TABLE tb_produto RENAME TO tb_prod;

Verificar a estrutura da tabela:

\d tb_prod

                                     Table "public.tb_prod"
    Column     |         Type          |                        Modifiers                        
---------------+-----------------------+---------------------------------------------------------
 id            | integer               | not null default nextval('tb_produto_id_seq'::regclass)
 nome          | character varying(50) | not null
 preco         | numeric(7,2)          | not null
 descricao     | text                  |
 campo_inteiro | integer               |
Indexes:
    "tb_produto_pkey" PRIMARY KEY, btree (id)

Criação de uma nova tabela:

CREATE TABLE tb_foo (campo INT);

Criação de um novo schema:

CREATE SCHEMA sc_teste;

Listando os schemas:

SELECT nspname AS schema FROM pg_namespace;

       schema       
--------------------
 pg_toast
 pg_temp_1
 pg_toast_temp_1
 pg_catalog
 public
 information_schema
 sc_teste

Criação de uma nova tabela:

CREATE TABLE tb_foo (campo INT);

Criação de uma nova tabela no novo schema:

CREATE TABLE sc_teste.tb_foo(
    campo1 INT,
    campo2 INT);

Pelo catálogo do sistema verificar as tabelas criadas pelo usuário:

SELECT tablename AS tabela, schemaname AS schema
    FROM pg_tables
    WHERE schemaname !~ 'information_schema|pg_.*';

 tabela  |  schema  
---------+----------
 tb_prod | public
 tb_foo  | public
 tb_foo  | sc_teste

Criação de uma view baseada na consulta anterior:

CREATE VIEW vw_tabelas AS
    SELECT tablename AS tabela, schemaname AS schema
    FROM pg_tables
    WHERE schemaname !~ 'information_schema|pg_.*';

Consulta na view criada:

SELECT schema || '.' || tabela AS "Tabela com namespace" FROM vw_tabelas;

 Tabela com namespace
----------------------
 public.tb_prod
 public.tb_foo
 sc_teste.tb_foo

Apagando as tabelas criadas:

DROP TABLE public.tb_prod, public.tb_foo, sc_teste.tb_foo;

Apagando a view criada:

DROP VIEW vw_tabelas;

Apagando o schema criado:

DROP SCHEMA sc_teste;

DML

Data Manipulation Language é a parte da linguagem SQL que trata da manipulação de registros.
Fazendo uma analogia, em linguagens de programação temos o conceito de CRUD:

CRUD	SQL
Create (criar)	INSERT
Retrieve (buscar)	SELECT
Update (modificar)	UPDATE
Delete (apagar)	DELETE

Criação de tabela de teste:

CREATE TABLE tb_teste(
    id serial PRIMARY KEY,
    campo1 varchar(10),
    campo2 int);

Verificando a estrutura da tabela:

\d tb_teste

                                Table "public.tb_teste"
 Column |         Type          |                       Modifiers                       
--------+-----------------------+-------------------------------------------------------
 id     | integer               | not null default nextval('tb_teste_id_seq'::regclass)
 campo1 | character varying(10) |
 campo2 | integer               |
Indexes:
    "tb_teste_pkey" PRIMARY KEY, btree (id)

Inserir um registro:

INSERT INTO tb_teste (campo1, campo2) VALUES ('foo', 25);

Veriricar o valor atual da sequence:

SELECT currval('tb_teste_id_seq');

 currval
---------
       1

Inserir valores:

INSERT INTO tb_teste VALUES (2, 'bar', (random() * 100)::int);

Veriricar o valor atual da sequence:

SELECT currval('tb_teste_id_seq');

 currval
---------
       1

INSERT múltiplo:

INSERT INTO tb_teste (campo1, campo2) VALUES
    ('spam', 58),
    ('eggs', 87),
    ('foobar', 92),
    ('spameggs', 43),
    ('eggsspam', 99);

ERROR:  duplicate key value violates unique constraint "tb_teste_pkey"
DETAIL:  Key (id)=(2) already exists.

Veriricar o valor atual da sequence:

SELECT currval('tb_teste_id_seq');

 currval
---------
       2

INSERT múltiplo:

INSERT INTO tb_teste (campo1, campo2) VALUES
    ('spam', 58),
    ('eggs', 87),
    ('foobar', 92),
    ('spameggs', 43),
    ('eggsspam', 99);

INSERT com SELECT:

INSERT INTO tb_teste (campo1, campo2)
    SELECT 'string', 77;

Comando TABLE para selecionar todos os registros e todas as colunas:

TABLE tb_teste;

 id |  campo1  | campo2
----+----------+--------
  1 | foo      |     25
  2 | bar      |     12
  3 | spam     |     58
  4 | eggs     |     87
  5 | foobar   |     92
  6 | spameggs |     43
  7 | eggsspam |     99
  8 | string   |     77

Selecionar todos os registros e todas as colunas:

SELECT * FROM tb_teste;

 id |  campo1  | campo2
----+----------+--------
  1 | foo      |     25
  2 | bar      |     12
  3 | spam     |     58
  4 | eggs     |     87
  5 | foobar   |     92
  6 | spameggs |     43
  7 | eggsspam |     99
  8 | string   |     77

Explicitar campos e filtrar por valores de id maior ou igual a 5:

SELECT id, campo2, campo1 FROM tb_teste WHERE id >= 5;

 id | campo2 |  campo1  
----+--------+----------
  5 |     92 | foobar
  6 |     43 | spameggs
  7 |     99 | eggsspam
  8 |     77 | string

Iniciar uma transação:

BEGIN;

UPDATE sem WHERE:

UPDATE tb_teste SET campo2 = 100;

Comando TABLE:

TABLE tb_teste;

 id |  campo1  | campo2
----+----------+--------
  1 | foo      |    100
  2 | bar      |    100
  3 | spam     |    100
  4 | eggs     |    100
  5 | foobar   |    100
  6 | spameggs |    100
  7 | eggsspam |    100
  8 | string   |    100

ROLLBACK na transação:

ROLLBACK;

Comando TABLE:

TABLE tb_teste;

 id |  campo1  | campo2
----+----------+--------
  1 | foo      |     25
  2 | bar      |     12
  3 | spam     |     58
  4 | eggs     |     87
  5 | foobar   |     92
  6 | spameggs |     43
  7 | eggsspam |     99
  8 | string   |     77

UPDATE com WHERE:

UPDATE tb_teste SET campo2 = 100 WHERE id = 2;

UPDATE com a cláusula BETWEEN e RETURNING:

UPDATE tb_teste SET (campo1, campo2) = (NULL, 404)
    WHERE id BETWEEN 5 AND 9
    RETURNING campo1, campo2;

 campo1 | campo2
--------+--------
        |    404
        |    404
        |    404
        |    404

Apagar todos registros onde o campo1 for NULL:

DELETE FROM tb_teste WHERE campo1 IS NULL;

DELETE com RETURNING:

DELETE FROM tb_teste WHERE id = 4 RETURNING campo1, campo2;

 campo1 | campo2
--------+--------
 eggs   |     87

Apagar a tabela de teste:

DROP TABLE tb_teste;

Criar a tabela de teste baseada em uma consulta:

CREATE TABLE tb_teste AS SELECT generate_series(1, 2000000);

Habilitar o cronômetro do psql:

\timing

DELETE sem WHERE:

DELETE FROM tb_teste;

Time: 8252,219 ms

Apagar a tabela de teste:

DROP TABLE tb_teste;

Criar a tabela de teste baseada em uma consulta:

CREATE TABLE tb_teste AS SELECT generate_series(1, 2000000);

TRUNCATE na tabela:

TRUNCATE tb_teste;

Time: 37,142 ms

Inserir valores através da função generate_series:

INSERT INTO tb_teste SELECT generate_series(1, 20);

Veriricar a tabela:

TABLE tb_teste;

 generate_series
-----------------
               1
               2
               3
               4
               5
               6
               7
               8
               9
              10
              11
              12
              13
              14
              15
              16
              17
              18
              19
              20

Limitar a 5 registros a serem exibidos:

SELECT * FROM tb_teste LIMIT 5;

 generate_series
-----------------
               1
               2
               3
               4
               5

Limitar a 5 registros a serem exibidos em ordem decrescente:

SELECT generate_series FROM tb_teste ORDER BY generate_series DESC LIMIT 5;

 generate_series
-----------------
              20
              19
              18
              17
              16

Não exibir 15 registros:

SELECT generate_series FROM tb_teste OFFSET 15;

 generate_series
-----------------
              16
              17
              18
              19
              20

Paginação de 5 em 5:

SELECT generate_series FROM tb_teste LIMIT 5 OFFSET 0;

 generate_series
-----------------
               1
               2
               3
               4
               5

Paginação de 5 em 5:

SELECT generate_series FROM tb_teste LIMIT 5 OFFSET 5;

 generate_series
-----------------
               6
               7
               8
               9
              10

Paginação de 5 em 5:

SELECT generate_series FROM tb_teste LIMIT 5 OFFSET 10;

 generate_series
-----------------
              11
              12
              13
              14
              15

Chave Estrangeira

Especifica que o valor da coluna deve corresponder a um valor que esteja na coluna da tabela referenciada. Os valores dos campos referenciados devem ser únicos. Chamamos isso de integridade referencial.

Criação da Tabela tb_uf:

CREATE TEMP TABLE tb_uf(
    id char(2) PRIMARY KEY,
    nome VARCHAR(30));

Criação da Tabela tb_cidade:

CREATE TEMP TABLE tb_cidade(
    id serial PRIMARY KEY,
    nome VARCHAR(40),
    uf char(2) REFERENCES tb_uf (id));

Tentativa de exclusão da tabela referenciada:

DROP TABLE tb_uf;

ERROR:  cannot drop table tb_uf because other objects depend on it
DETAIL:  constraint tb_cidade_uf_fkey on table tb_cidade depends on table tb_uf
HINT:  Use DROP ... CASCADE to drop the dependent objects too.

Descrição da estrutura de tb_uf:

\d tb_uf

          Table "pg_temp_2.tb_uf"
 Column |         Type          | Modifiers
--------+-----------------------+-----------
 id     | character(2)          | not null
 nome   | character varying(30) |
Indexes:
    "tb_uf_pkey" PRIMARY KEY, btree (id)
Referenced by:
    TABLE "tb_cidade" CONSTRAINT "tb_cidade_uf_fkey" FOREIGN KEY (uf) REFERENCES tb_uf(id)

Descrição da estrutura de tb_cidade:

\d tb_cidade

                               Table "pg_temp_4.tb_cidade"
 Column |         Type          |                       Modifiers                        
--------+-----------------------+--------------------------------------------------------
 id     | integer               | not null default nextval('tb_cidade_id_seq'::regclass)
 nome   | character varying(40) |
 uf     | character(2)          |
Indexes:
    "tb_cidade_pkey" PRIMARY KEY, btree (id)
Foreign-key constraints:
    "tb_cidade_uf_fkey" FOREIGN KEY (uf) REFERENCES tb_uf(id)

Comando COPY para popular a tabela:

COPY tb_uf (id, nome) FROM STDIN DELIMITER ',';

Enter data to be copied followed by a newline.
End with a backslash and a period on a line by itself.
>>

Em seguida os registros:

MG,MINAS GERAIS
SP,SÃO PAULO
RR,RORAIMA
AC,ACRE
AL,ALAGOAS
AP,AMAPÁ
AM,AMAZONAS
BA,BAHIA
CE,CEARÁ
DF,DISTRITO FEDERAL
ES,ESPÍRITO SANTO
GO,GOIÁS
MA,MARANHÃO
MT,MATO GROSSO
MS,MATO GROSSO DO SUL
PA,PARÁ
PR,PARANÁ
PE,PERNAMBUCO
PI,PIAUÍ
RJ,RIO DE JANEIRO
RN,RIO GRANDE DO NORTE
RS,RIO GRANDE DO SUL
RO,RONDÔNIA
SC,SANTA CATARINA
SE,SERGIPE
TO,TOCANTINS
PB,PARAIBA

Dê <ENTER> e logo em seguida <Ctrl> + <D>.

Inserir valores para a tabela tb_cidade:

INSERT INTO tb_cidade (nome, uf) VALUES
    ('São Paulo', 'SP'),
    ('Belo Horizonte', 'MG'),
    ('Vitória', 'ES'),
    ('Rio de Janeiro', 'RJ');

Tentativa de inserir valores cuja chave estrangeira não existe na tabela referenciada:

INSERT INTO tb_cidade (nome, uf) VALUES
    ('foo', 'NN'),
    ('bar', 'NN');

ERROR:  insert or update on table "tb_cidade" violates foreign key constraint "tb_cidade_uf_fkey"
DETAIL:  Key (uf)=(NN) is not present in table "tb_uf".

Inserir um registro novo em tb_uf para possibilitar o INSERT anterior:

INSERT INTO tb_uf (id, nome) VALUES ('NN', '...');

Inserir valores novos em tb_cidade:

INSERT INTO tb_cidade (nome, uf) VALUES
    ('foo', 'NN'),
    ('bar', 'NN');

Tentativa de apagar o registro da tabela referenciada:

DELETE FROM tb_uf WHERE id = 'NN';

ERROR:  update or delete on table "tb_uf" violates foreign key constraint "tb_cidade_uf_fkey" on table "tb_cidade"
DETAIL:  Key (id)=(NN) is still referenced from table "tb_cidade".

Apagando os registros da tabela referenciadora:

DELETE FROM tb_cidade WHERE uf = 'NN';

Tentativa de apagar o registro da tabela referenciada:

DELETE FROM tb_uf WHERE id = 'NN';

Apagando a tabela referenciada em modo cascata:

DROP TABLE tb_uf CASCADE;

NOTICE:  drop cascades to constraint tb_cidade_uf_fkey on table tb_cidade

Verificando a estrutura da tabela tb_cidade:

\d tb_cidade

                               Table "pg_temp_4.tb_cidade"
 Column |         Type          |                       Modifiers                        
--------+-----------------------+--------------------------------------------------------
 id     | integer               | not null default nextval('tb_cidade_id_seq'::regclass)
 nome   | character varying(40) |
 uf     | character(2)          |
Indexes:
    "tb_cidade_pkey" PRIMARY KEY, btree (id)

Subqueries

Também conhecidas como subqueries, são SELECTs embutidos dentro de outro SELECT que têm por finalidade flexibilizar consultas. Esse recurso está disponível no PostgreSQL desde a versão 6.3.

Clonar o repositório db_empresa para os próximos exercícios:

git clone https://github.com/juliano777/db_empresa.git

Entrar no diretório db_empresa:

cd db_empresa/

Criar a estrutura da base de dados db_empresa:

psql -f db_empresa-schema.sql

Carregar os dados da base db_empresa:

psql -f db_empresa-data.sql db_empresa

Via shell, pelo psql se conectar na base:

psql db_empresa

Exibir os CPFs dos colaboradores cujo salário seja maior do que média com 90% de acréscimo:

SELECT c1.cpf
    FROM tb_colaborador c1
    WHERE c1.salario > (SELECT (avg(c2.salario) * 1.9)
                     FROM tb_colaborador c2);

cpf     
-------------
11111111111
23625814788
12345678901

Exibir o CPF e a diferença do salário relativa à média:

SELECT c1.cpf "CPF", c1.salario -
    (SELECT avg(c2.salario) FROM tb_colaborador c2)::numeric(7, 2)
    "Diferença da Média"
    FROM tb_colaborador c1
    LIMIT 5;

CPF          | Diferença da Média
-------------+--------------------
11111111111  |           17445.00
23625814788  |            7445.00
33344455511  |            1945.00
12345678901  |            2445.00
10236547895  |             945.00

Selecionar id de tb_colaborador onde o cpf não está entre os valores retornados da subconsulta e o setor deve ser igual a 3:

SELECT c.id
    FROM tb_colaborador c
    WHERE c.cpf NOT IN
        (SELECT p.cpf
            FROM tb_pf p
            WHERE p.dt_Nascto
                BETWEEN '1982-01-01' AND '1983-12-31') AND setor = 3;

id
----
 9
11
12
13
15

CTE

A cláusula WITH fornece uma maneira de escrever comandos auxiliares para uso em uma consulta maior. Esses comandos, que são frequentemente referenciados como Common Table Expressions ou CTEs, pode ser pensado como a definição de tabelas temporárias que existem apenas para uma consulta.
Cada comando auxiliar em uma cláusula WITH pode ser um SELECT, INSERT, UPDATE, ou DELETE; e a cláusula WITH por si só é anexada a um comando principal que pode também ser um SELECT, INSERT, UPDATE, ou DELETE.

Exibir os CPFs dos colaboradores cujo salário seja maior do que média com 90% de acréscimo:

WITH c2 AS (SELECT (avg(salario) * 1.9) AS media FROM tb_colaborador)
    SELECT c1.cpf
        FROM tb_colaborador c1, c2
        WHERE c1.salario > c2.media;

cpf     
-------------
11111111111
23625814788
12345678901

Exibir o CPF e a diferença do salário relativa à média:

WITH c2 AS (SELECT avg(salario)::numeric(7, 2) media
            FROM tb_colaborador)
    SELECT c1.cpf "CPF", c1.salario - c2.media "Diferença da Média"
        FROM tb_colaborador c1, c2
        LIMIT 5;

CPF          | Diferença da Média
-------------+--------------------
11111111111  |           17445.00
23625814788  |            7445.00
33344455511  |            1945.00
12345678901  |            2445.00
10236547895  |             945.00

Junções

CROSS JOIN

Retorna um conjunto de informações o qual é resultante de todas as combinações possíveis entre os registros das tabelas envolvidas.

Criação da tabela de carros:

CREATE TEMP TABLE tb_carro(
    id serial PRIMARY KEY,
    nome VARCHAR(20));

Criação da tabela de cores:

CREATE TEMP TABLE tb_cor(
    id serial PRIMARY KEY,
    nome VARCHAR(20));

Popular a tabela de carros:

INSERT INTO tb_carro (nome) VALUES
    ('Fiat 147'),
    ('VW Fusca'),
    ('Ford Corcel'),
    ('GM Opala');

Popular a tabela de cores:

INSERT INTO tb_cor (nome) VALUES
    ('Verde'),
    ('Azul'),
    ('Amarelo'),
    ('Branco'),
    ('Preto'),
    ('Vermelho'),
    ('Laranja'),
    ('Cinza');

Duas formas diferentes para fazer junção cruzada para obter as combinações possíveis exibindo somente os primeiros 5 registros:

SELECT c1.nome carro, c2.nome cor
    FROM tb_carro c1, tb_cor c2
    LIMIT 5;

SELECT c1.nome carro, c2.nome cor
    FROM tb_carro c1
    CROSS JOIN
    tb_cor c2
    LIMIT 5;

carro     |   cor   
----------+---------
Fiat 147  | Verde
Fiat 147  | Azul
Fiat 147  | Amarelo
Fiat 147  | Branco
Fiat 147  | Preto

NATURAL JOIN

Faz uma junção implícita tomando como base as colunas de mesmo nome nas tabelas envolvidas.
É recomendável que ao invés de usar NATURAL JOIN se use INNER JOIN, pois essa última explicita qual é o critério de vínculo entre tabelas deixando a leitura mais amigável.

Duas formas diferentes para fazer junção cruzada para obter as combinações possíveis exibindo somente os primeiros 5 registros:

SELECT p.nome, p.sobrenome, c.salario
    FROM tb_colaborador c
    NATURAL JOIN tb_pf p
    WHERE c.salario >= 5000;

nome        | sobrenome | salario  
------------+-----------+----------
Chiquinho   | da Silva  | 20000.00
Aldebarina  | Ferreira  | 10000.00
Tungstênia  | Santana   |  5000.00

INNER JOIN

Retorna as informações apenas de acordo com as linhas que obedeçam as definições de relacionamento. Existe uma ligação lógica para se fazer a junção, a qual é declarada explicitamente.
É a junção padrão, que faz com que inclusive a palavra-chave INNER possa ser omitida.
Para o critério de junção pode-se usar a cláusula ON que especifica qual a condição usada ou USING que apenas diz qual campo com o mesmo nome em ambas as tabelas deve ser utilizado.

INNER JOINs com ON e USING:

SELECT p.nome, p.sobrenome, c.salario
    FROM tb_colaborador c
    INNER JOIN tb_pf p
    ON c.cpf = p.cpf
    WHERE c.salario >= 5000;

SELECT p.nome, p.sobrenome, c.salario
    FROM tb_colaborador c
    INNER JOIN tb_pf p
    USING (cpf)
    WHERE c.salario >= 5000;

nome        | sobrenome | salario  
------------+-----------+----------
Chiquinho   | da Silva  | 20000.00
Aldebarina  | Ferreira  | 10000.00
Tungstênia  | Santana   |  5000.00

OUTER JOIN

Assim como na INNER JOIN, existe uma ligação lógica, mas não retorna apenas as informações que satisfaçam a regra da junção. OUTER JOINs podem ser dos tipos:

LEFT OUTER JOIN: retorna todos os registros da tabela à esquerda;
RIGHT OUTER JOIN: retorna todos os registros da tabela à direita;
FULL OUTER JOIN: retorna todos os registros de ambos os lados.

É de uso opcional a palavra OUTER.
Para os exercícios serão inseridos dados na tabela tb_pf, que não tenham correspondência na tabela tb_colaborador.

Inserir valores para os testes:

INSERT INTO tb_pf VALUES
    ('Elzinda', '1979-05-03', NULL, '10293847567', '2233551177', 'Ambrózio',
     'f'),
    ('Carmelita', '1915-01-01', NULL, '00000000011', '0000000011', 'Antunes',
     'f'),
    ('Sizorfino', '1978-11-26', NULL, '00000000111', '0000000111', 'Chagas',
     'm');

LEFT OUTER JOIN

Tabela tb_pf à esquerda:

SELECT p.nome||' '||p.sobrenome "Nome Completo", c.id
    FROM tb_pf p
    LEFT OUTER JOIN tb_colaborador c
        USING (cpf)
    OFFSET 35;

Nome Completo       | id
--------------------+----
Estriga Souto       | 36
Eltaminácio Santos  | 37
Maria dos Santos    | 38
Etelvino Castro     | 39
Carzózio da Silva   | 40
Genovézio Gomes     |   
Carmelita Antunes   |   
Elzinda Ambrózio    |   
Sizorfino Chagas    |

RIGHT OUTER JOIN

Tabela tb_pf à direita:

SELECT p.nome||' '||p.sobrenome "Nome Completo", c.id
    FROM tb_colaborador c
    RIGHT OUTER JOIN tb_pf p USING (cpf)
    OFFSET 35;

Nome Completo       | id
--------------------+----
Estriga Souto       | 36
Eltaminácio Santos  | 37
Maria dos Santos    | 38
Etelvino Castro     | 39
Carzózio da Silva   | 40
Genovézio Gomes     |   
Carmelita Antunes   |   
Elzinda Ambrózio    |   
Sizorfino Chagas    |

FULL OUTER JOIN

FULL OUTER JOIN:

SELECT p.nome||' '||p.sobrenome "Nome Completo", c.id
    FROM tb_pf p
    FULL OUTER JOIN tb_colaborador c USING (cpf)
    OFFSET 35;

SELECT p.nome||' '||p.sobrenome "Nome Completo", c.id
    FROM tb_colaborador c
    FULL OUTER JOIN tb_pf p USING (cpf)
    OFFSET 35;

Nome Completo       | id
--------------------+----
Estriga Souto       | 36
Eltaminácio Santos  | 37
Maria dos Santos    | 38
Etelvino Castro     | 39
Carzózio da Silva   | 40
Genovézio Gomes     |   
Carmelita Antunes   |   
Elzinda Ambrózio    |   
Sizorfino Chagas    |

Indexação

Um índice (INDEX) é um recurso que agiliza buscas de informações em tabelas. Imagine que você está em uma biblioteca e gostaria de procurar “O Senhor dos Anéis”, de Tolkien. O que seria mais fácil?: Começar a vasculhar a biblioteca inteira até achar o livro desejado ou buscar no arquivo da biblioteca, nas fichas que estão ordenados por autor? Logicamente se for escolhido ir buscar nas fichas a busca será muito mais rápida, pois não será necessário vasculhar livro por livro na biblioteca, porque haverá uma ficha do autor e daquele livro que mostrará exatamente onde está o livro desejado. É um apontamento para a localização do livro. Um índice de banco de dados funciona da mesma forma.
Indexamos campos usados como critérios de filtragem numa consulta (cláusula WHERE, por exemplo) e aqueles cujos valores são mais restritivos comparados a outros valores da tabela.
Seu funcionamento consiste em criar ponteiros para dados gravados em campos específicos. Quando não existe índice num campo usado como critério de filtragem, é feita uma varredura em toda a tabela, de maneira que haverá execuções de entrada e saída (I/O) de disco desnecessárias, além de também desperdiçar processamento.

Dicas Gerais

Crie índices para campos que são utilizados em condições de consultas, pelo menos as consultas mais frequentes;
Crie índices para campos de chaves estrangeiras e em campos envolvidos como critérios de junção (JOIN);
Se houver uma consulta frequente utilize índices parciais com sua condição conforme a consulta;
Para consultas que buscam faixas de valores é bom ter um índice clusterizado para isso.

Criação de tabela de teste:

SELECT
    generate_series(1, 20000)::int2 AS campo1, -- 20 mil registros
    round((random()*10000))::int2 AS campo2,
    round((random()*10000))::int2 AS campo3 INTO tb_index;

Verificando o plano de execução:

EXPLAIN ANALYZE
SELECT campo1 FROM tb_index WHERE campo2 BETWEEN 235 AND 587;

QUERY PLAN                                                
---------------------------------------------------------------------------------------------------------
Seq Scan on tb_index  (cost=0.00..389.00 rows=688 width=2) (actual time=0.036..10.163 rows=679 loops=1)
Filter: ((campo2 >= 235) AND (campo2 <= 587))
Rows Removed by Filter: 19321
Planning time: 0.189 ms
Execution time: 10.245 ms

Criação de índice:

CREATE INDEX idx_tb_index_campo2 ON tb_index (campo2);

Verificando o plano de execução:

EXPLAIN ANALYZE
SELECT campo1 FROM tb_index WHERE campo2 BETWEEN 235 AND 587;

    QUERY PLAN                                                            
---------------------------------------------------------------------------------------------------------------------------------
Bitmap Heap Scan on tb_index  (cost=15.34..114.66 rows=688 width=2) (actual time=0.344..0.981 rows=679 loops=1)
Recheck Cond: ((campo2 >= 235) AND (campo2 <= 587))
Heap Blocks: exact=89
->  Bitmap Index Scan on idx_tb_index_campo2  (cost=0.00..15.17 rows=688 width=0) (actual time=0.305..0.305 rows=679 loops=1)
Index Cond: ((campo2 >= 235) AND (campo2 <= 587))
Planning time: 0.363 ms
Execution time: 1.073 ms

Criação de índice composto:

CREATE INDEX idx_tb_index_campo2_campo3 ON tb_index (campo2, campo3);

Verificando o plano de consulta:

EXPLAIN ANALYZE
SELECT campo1 FROM tb_index
    WHERE (campo2 BETWEEN 235 AND 587) AND campo3 = 1000;

QUERY PLAN                                                              
--------------------------------------------------------------------------------------------------------------------------------------
Index Scan using idx_tb_index_campo2_campo3 on tb_index  (cost=0.29..20.90 rows=1 width=2) (actual time=0.086..0.190 rows=1 loops=1)
Index Cond: ((campo2 >= 235) AND (campo2 <= 587) AND (campo3 = 1000))
Planning time: 0.414 ms
Execution time: 0.227 ms

Apagando a tabela do exercício anterior:

DROP TABLE tb_index;

Criação da Tabela de Teste (Não Temporária):

CREATE TABLE tb_index(campo1 int);

Inserção de 1 Milhão de Registros:

INSERT INTO tb_index SELECT generate_series(1, 1000000);

Análise sem Índices de Valores Múltiplos de 19:

EXPLAIN ANALYZE
SELECT * FROM tb_index WHERE campo1 % 19 = 0;

QUERY PLAN                                                   
---------------------------------------------------------------------------------------------------------------
Seq Scan on tb_index  (cost=0.00..19425.00 rows=5000 width=4) (actual time=0.033..309.389 rows=52631 loops=1)
Filter: ((campo1 % 19) = 0)
Rows Removed by Filter: 947369
Planning time: 0.117 ms
Execution time: 311.717 ms

Criação de Índice Total:

CREATE INDEX idx_teste_index_total ON tb_index (campo1);

Verifica o plano de execução:

EXPLAIN ANALYZE
SELECT * FROM tb_index WHERE campo1 % 19 = 0;

QUERY PLAN                                                   
---------------------------------------------------------------------------------------------------------------
Seq Scan on tb_index  (cost=0.00..19425.00 rows=5000 width=4) (actual time=0.036..313.418 rows=52631 loops=1)
Filter: ((campo1 % 19) = 0)
Rows Removed by Filter: 947369
Planning time: 0.271 ms
Execution time: 315.805 ms

Criação de índice parcial múltiplos de 19:

CREATE INDEX idx_teste_index_19 ON tb_index (campo1) WHERE campo1 % 19 = 0;

Análise com valores múltiplos de 19:

EXPLAIN ANALYZE
SELECT * FROM tb_index WHERE campo1 % 19 = 0;

QUERY PLAN                                                                 
--------------------------------------------------------------------------------------------------------------------------------------------
Index Only Scan using idx_teste_index_19 on tb_index  (cost=0.29..157.29 rows=5000 width=4) (actual time=0.053..37.198 rows=52631 loops=1)
Heap Fetches: 52631
Planning time: 0.321 ms
Execution time: 40.926 ms

Análise com uma consulta de condição diferente de números divíveis por 19:

EXPLAIN ANALYZE
SELECT * FROM tb_index WHERE campo1 BETWEEN 241 AND 875;

QUERY PLAN                                                                
------------------------------------------------------------------------------------------------------------------------------------------
Index Only Scan using idx_teste_index_total on tb_index  (cost=0.42..26.82 rows=620 width=4) (actual time=0.043..0.487 rows=635 loops=1)
Index Cond: ((campo1 >= 241) AND (campo1 <= 875))
Heap Fetches: 635
Planning time: 0.333 ms
Execution time: 0.563 ms

Range Types

Range Types são tipos de dados que representam uma faixa de valores de algum tipo de elemento (chamado de subtipo de faixa).

Simbologia de Limites de Intervalos

( ) → Parênteses: para simbolizar respectivamente limites inicial e final do tipo aberto;
[ ] → Colchetes: representam respectivamente limites inicial e final do tipo fechado.

Built-in Range Types

O PostgreSQL nativamente vem com os seguintes range types:

int4range: Inteiro de 4 bytes (int4, int, integer);
int8range: Inteiro de 8 bytes (int8, bigint);
numrange: Ponto flutuante (numeric);
tsrange: timestamp sem time zone;
tstzrange: timestamp com time zone;
daterange: Data (date)

Em adição, você pode definir seus próprios range types; veja CREATE TYPE para mais informações.

Intervalo fechado de 2 a 9 (int4):

SELECT '[2, 9]'::int4range;

int4range
-----------
[2,10)

Intervalo aberto em 2 e fechado em 9 (int4):

SELECT '(2, 9]'::int4range;

int4range
-----------
[3,10)

Intervalos fechados usando data:

SELECT '[2017-07-15 09:00, 2017-07-15 14:00]'::tsrange;

tsrange                    
-----------------------------------------------
["2017-07-15 09:00:00","2017-07-15 14:00:00"]

No intervalo de 10 a 20 contém 3 (função int4range)?

SELECT int4range(10, 20) @> 3;

 ?column?
----------
 f

O valor 10 está contido entre 10 e 20 (função int4range)?

SELECT 10 <@ int4range(10, 20);

?column?
----------
t

Para fixação dos conceitos aprendidos nos exercícios anteriores, agora vamos criar uma tabela de reservas:

CREATE TABLE tb_reserva(
    sala int PRIMARY KEY,
    duracao tsrange);

Populando a tabela:

INSERT INTO tb_reserva VALUES
    (1, '[2014-11-01 14:30, 2014-11-01 18:30)'),
    (2, '[2014-11-02 11:00, 2014-11-02 15:00)'),
    (3, '[2014-11-03 11:00, 2014-11-03 15:00)'),
    (4, '[2014-11-04 17:00, 2014-11-04 19:00)');

Verificando a tabela:

TABLE tb_reserva;

sala  |                    duracao                    
------+-----------------------------------------------
   1  | ["2014-11-01 14:30:00","2014-11-01 18:30:00")
   2  | ["2014-11-02 11:00:00","2014-11-02 15:00:00")
   3  | ["2014-11-03 11:00:00","2014-11-03 15:00:00")
   4  | ["2014-11-04 17:00:00","2014-11-04 19:00:00")

Verificando se há alguma sala cuja data e hora esteja contida em alguma duração de reserva:

SELECT * FROM tb_reserva WHERE '2014-11-02 12:33'::timestamp <@ duracao;

sala  |                    duracao                    
------+-----------------------------------------------
   2  | ["2014-11-02 11:00:00","2014-11-02 15:00:00")

Verificando se há alguma sala cuja duração contém a data e hora informada:

SELECT * FROM tb_reserva WHERE duracao @> '2014-11-03 14:21'::timestamp;

sala  |                    duracao                    
------+-----------------------------------------------
   3  | ["2014-11-03 11:00:00","2014-11-03 15:00:00")

DOMAIN

Domínio é um tipo de dado personalizado em que se pode definir como os dados serão inseridos de acordo com restrições definidas opcionalmente.

Criação de um domínio, para validar CEPs que aceita inteiros com sete ou oito dígitos:

CREATE DOMAIN dom_cep AS integer
    CONSTRAINT chk_cep
        CHECK (length(VALUE::text) = 7
        OR length(VALUE::text) = 8);

Criação de uma tabela que usará o domínio criado como tipo de dado para uma coluna:

CREATE TEMP TABLE tb_endereco_tmp(
    id serial PRIMARY KEY,
    cep dom_cep,
    logradouro text,
    numero smallint,
    cidade varchar(50),
    uf char(2));

Inserções na Tabela com o domíno criado:

INSERT INTO tb_endereco_tmp (cep, logradouro, numero, cidade, uf) VALUES
    (1001000, 'Pça. da Sé', null,'São Paulo','SP'),
    (30130003, 'Av. Afonso Pena', 1212, 'Belo Horizonte', 'MG');

Selecionando os dados:

SELECT
    to_char(cep, '00000-000') "CEP",
    logradouro "Logradouro",
    numero "Número",
    cidade "Cidade",
    uf "Estado"
    FROM tb_endereco_tmp;

    CEP     |   Logradouro    | Número |     Cidade     | Estado
------------+-----------------+--------+----------------+--------
  01001-000 | Pça. da Sé      |        | São Paulo      | SP
  30130-003 | Av. Afonso Pena |   1212 | Belo Horizonte | MG

Acessando o Postgres via Python (psycopg2)

import pprint  # Módulo "Pretty Print"
import psycopg2  # Driver PostgreSQL

# String de conexão
str_conexao = """
dbname='db_empresa'
user='aluno'
password='123'
host='192.168.56.2'
application_name='pypg'
options='-c log_min_duration_statement=0'
"""

# Dentro do bloco try fazer a conexão ao banco
try:
    # Conexão ao banco
    conexao = psycopg2.connect(str_conexao)

except Exception as e:
    # Exibe a string abaixo e também a mensagem de Exception
    print('Erro de conexão!\n\n{}'.format(e))

# Após a conexão devidamente estabelecida se conecte ao servidor de banco
# de dados via SSH.
# Se conecte localmente via psql e execute a seguinte query:
# SELECT * FROM pg_stat_activity WHERE client_addr IS NOT NULL;



# Criação de cursor para executar queries
cursor = conexao.cursor()


# String SQL
str_sql = 'SELECT cpf, nome, sobrenome FROM tb_pf;'

# Executa o comando SQL
cursor.execute(str_sql)

# Linhas retornadas pela consulta
rows = cursor.fetchall()

# Verifica o tipo da variável
type(rows)

# Criação da variável para impressão amigável em tela
pp = pprint.PrettyPrinter(indent=4)

# Método pprint para exibir de forma amigável o conteúdo de rows
pp.pprint(rows)

# Exibe a segunda linha
print(rows[1])

# Segunda linha e primeira coluna (cpf)
print(rows[1][0])


# String SQL
str_sql = "INSERT INTO tb_pf (cpf, nome) VALUES (95123785247, 'Foo');"


# Executa o comando SQL
cursor.execute(str_sql)


# Verifique no banco se o registro foi inserido

# Verifica se a conexão está fechada (0 = aberta, 1 = fechada)
conexao.closed

# Verifica se o cursor está fechado (booleano)
cursor.closed

# Efetiva todos os comandos dados na conexão
conexao.commit()

# Fecha a conexão
conexao.close()

# Checa se a conexão está fechada
conexao.closed

# Checa se o cursor está fechado
cursor.closed

# Fazer uma nova conexão
try:
    # Conexão ao banco
    conexao = psycopg2.connect(str_conexao)

except Exception as e:
    # Exibe a string abaixo e também a mensagem de Exception
    print('Erro de conexão!\n\n{}'.format(e))

# Determina que a conexão não será transacional
conexao.set_session(readonly=False, autocommit=True)

# Criação de um novo cursor
cursor = conexao.cursor()

# String SQL
str_sql = "INSERT INTO tb_pf (cpf, nome) VALUES (17223785247, 'Bar');"

# Executa o comando SQL
cursor.execute(str_sql)

# Determina que a conexão será somente leitura
conexao.set_session(readonly=True, autocommit=True)


# String SQL
str_sql = "INSERT INTO tb_pf (cpf, nome) VALUES (33223785247, 'Foo Bar');"


# Executa o comando SQL
cursor.execute(str_sql)

PL/Python: Programando em Python no PostgreSQL

Sintaxe:

CREATE [OR REPLACE FUNCTION] funcao([params])
RETURNS tipo AS $$
. . .
codigo
. . .
$$ LANGUAGE linguagem;

PL/pgSQL

Criação da função fc_foo sem parâmetros:

CREATE OR REPLACE FUNCTION fc_foo()
RETURNS VARCHAR AS $$

BEGIN
    RETURN 'Hello, World!';
END; $$ LANGUAGE PLPGSQL;

Criação da função fc_foo com parâmetros:

CREATE OR REPLACE FUNCTION fc_foo(num1 INT, num2 INT)
RETURNS INT AS $$

DECLARE res INT;

BEGIN
    RETURN (num1 + num2) * 2;
END; $$ LANGUAGE PLPGSQL;

Execução da função fc_foo sem parâmetros:

SELECT fc_foo();

fc_foo     
---------------
Hello, World!

Execução da função fc_foo com parâmetros:

SELECT fc_foo(2, 5);

fc_foo
--------
    14

Blocos Anônimos