/rede-cnpj

Visualização gráfica de relacionamentos entre sócios e empresas com dados públicos de CNPJ.

Primary LanguagePythonMIT LicenseMIT

REDE-CNPJ - Visualização de dados públicos de CNPJ

Ferramenta para observar o relacionamento entre empresas e sócios, a partir dos dados públicos disponibilizados pela Receita Federal.

Vídeo no youtube

youtube


Outros vídeos de utilização:
Opções básicas dos botões: https://youtu.be/-Ug6ToTRnE4
Criar uma ligação no gráfico: https://youtu.be/8I0oNb4U9Rw
Aumentar tamanho da ligação: https://youtu.be/7hy74LE8e7A
Exportar dados como json: https://youtu.be/WKn02G9yHbQ
Arrastar células do Excel: https://youtu.be/Oxze-d4V7kE
A rotina possibilita visualizar de forma gráfica os relacionamentos entre empresas e sócios, a partir da base de dados públicos de cnpj da Receita Federal.
Foi testada nos navegadores Firefox, Edge e Chrome.

Versão online com base completa de dados públicos de CNPJ:

https://www.redecnpj.com.br
Leia as informações iniciais. As consultas podem ser feitas por CNPJ, o radical de CNPJ, Razão Social, Nome Fantasia, o Nome de Sócio ou CPF do Sócio (dá resultado impreciso). Pode-se inserir vários CNPJs de uma só vez, separando-os por Ponto e vírgula (;) ou ESPAÇO. Utilize o asterisco (*) na parte que faltar do nome.

Versão em python:

É preciso ter instalado no computador:

  • python versão 3.9 ou posterior.
  • 50GB de espaço livre, para utilizar a base de CNPJs em sqlite.

Use o comando
pip install -r requirements.txt
para instalar as bibliotecas utilizadas no projeto.

Para iniciar o script, em um console digite
python rede.py
A rotina abrirá o endereço http://127.0.0.1:5000/rede/ no navegador padrão. As opções por linha de comando são exibidas fazendo python rede.py -h
A pasta contém os arquivos rede_teste.db e cnpj_teste.db, que são amostras dos bancos de dados para testar o funcionamento da rotina.
Orientações detalhadas para instalação em Windows no link https://github.com/rictom/rede-cnpj/blob/master/doc/instalacao_windows.md

Como utilizar o Banco de dados públicos completo de CNPJs:

O projeto https://github.com/rictom/cnpj-sqlite contém o código para a conversão dos arquivos zipados do site da Receita para o formato SQLITE, gerando o arquivo cnpj.db com a base completa. O link para a base completa em sqlite já tratada está disponível em https://github.com/rictom/cnpj-sqlite#arquivo_sqlite.
O código foi ajustado para o formato disponibilizado pela Receita Federal em 2021 e 2022.
IMPORTANTE: Após gerar o arquivo cnpj.db, será necessário gerar também o arquivo rede.db que é uma tabela pré-processada com os vínculos entre empresas e sócios, com o uso do script rede_cria_tabela.py.
Altere o arquivo de configuração rede.ini, mudando as linhas de configuração para
base_rede = rede.db
base_receita = cnpj.db

Opções:

A roda do mouse expande ou diminui o tamanho da exibição.
Fazendo click duplo em um ícone, a rotina expande as ligações. Por exemplo, clique duplo no ícone de uma pessoa, exibirá todas as empresas que esta é sócia. Clique duplo em um ícone de CNPJ, exibirá todos os sócios da empresa.
Apertando SHIFT, é possível selecionar mais de um ícone.
Pressionando CTRL e arrastando na tela, adiciona a seleção os itens da área. Clicar no botão do meio do mouse (roda) faz aparecer janela para editar uma Nota, que aparece numa terceira linha abaixo do ícone.

Outras opções da rede estão no menu contextual do mouse (botão direito), sendo configuradas teclas de atalho correspondentes aos comandos:

Tecla – Descrição do comando.

  • TECLAS de 1 a 9 - Inserir camadas correspondente ao número sobre o nó selecionado;

  • I - Inserir CNPJ, Razão Social completa ou nome completo de sócio. Poderão ser colocados vários CNPJs ao mesmo tempo, separados por ponto e vírgula (;).

  • U - Criar item novo (que não seja PF ou PJ) e ligar aos itens selecionados;

  • E - Editar dados do item (que não seja PF ou PJ) selecionado;

  • CRTL+Z – Desfaz Inserção;

  • SubMenu Ligar:

  • U - Ligar para novo item;

  • L - Ligar itens selecionados, ligação tipo estrela (o primeiro ligado aos demais);

  • SHIFT+L - Remover ligação entre itens selecionados;

  • Remover Ligacoes - Remove todas as ligações dos itens selecionados;

  • K - Ligar itens selecionados, ligação tipo fila (o primeiro ligado ao segundo, o segundo ao terceiro, etc);

  • SubMenu Visualização:

  • A - Gráfico em Nova Aba - Abre aba com os itens selecionados;

  • Q - Quebrar o gráfico em abas - Divide o gráfico em partes menores, mantendo as ligações

  • Abre OpenStreetMap - Abre Mapa com os endereços de empresas;

  • P - Fixar o nó na posição;

  • SHIFT+P - Desfixar todos os nós do gráfico;

  • CTRL+P - Fixa um nó em cada grupo conexo (para evitar que o gráfico se expanda indefinidamente);

  • SubMenu Visualização>Rótulos:

  • E - Editar rótulo;

  • N - Rótulo - Exibe apenas o primeiro nome;

  • SHIFT+N - Oculta/exibe texto da ligação;

  • Alterar Ícone;

  • C - Colorir os nós selecionados;

  • Escolher Cor;

  • D – Abre um popup com dados;

  • SHIFT+D – Abre numa nova aba com Dados;

  • CTRL+D – Lista ids dos itens selecionados;

  • Altera o nome da aba;

  • Escala Inicial - Coloca a exibição sem zoom, na escala inicial.

  • Barra de Espaço - Parar/reiniciar leiaute (se a tela tiver muitos nós, os comandos funcionam melhor se o leiaute estiver parado);

  • F - Localizar - Localizar na Tela Nome, CNPJ ou CPF;

  • SHIFT+F - Localizar apenas na seleção;

  • CTRL+F - Localiza por campo (como cor do item);

  • J – Seleciona itens adjacentes;

  • SHIFT+J – Seleciona árvores dos itens selecionados;

  • CTRL+J - Itens com mais ligações - Opção para selecionar os itens do gráfico com mais ligações;

  • Itens ligados a coloridos;

  • Grupos com duas cores;

  • CTRL+A - Seleciona todos os itens;

  • CTRL+SHIFT+A - Inverte seleção;

  • SubMenu - Busca em sites:

  • G – Abre o nó numa aba do site Google;

  • SHIFT+G – Abre o endereço no Google Maps (só CNPJs);

  • H ou CTRL+G - Raspa a página do Google e coloca links;

  • SHIFT+H - Raspa a página do Google e busca palavras chave nos links;

  • Jusbrasil - Busca no site Jusbrasil

  • Portal da Transparência - Busca no Portal da Transparência;

  • SubMenu Salvar/Abrir:

  • Salvar dados em Excel;

  • Salvar em formato i2 Chart Reader;

  • Salvar imagem em formato SVG;

  • Salvar Arquivo Json - salva dados do gráfico no formato json;

  • Abrir Arquivo Json;

  • Exportar/Importar JSON ao Servidor - Exportar ou importar dados do gráfico em formato JSON carregados no servidor;

  • Banco de Dados - Exporta dados para banco de dados sqlite (só para usuário local);

  • SubMenu Excluir

  • DEL – Excluir itens selecionados.

  • SHIFT+DEL – Excluir todos os itens.

  • Excluir Nó mantendo Link;

  • Simplifica Gráfico - Remove itens nas bordas do gráfico que não tenham destaque;

  • Excluir itens isolados - Remove itens sem ligação.

Os comandos valem para o último nó selecionado ou nós selecionados, que ficam em destaque com a animação no contorno ods ícones. Pressionando SHIFT e click, é possível selecionar mais de um ícone para fazer Exclusão ou para Expansão de vínculos. Pode-se arrastar células com listas de CNPJs do Excel para a janela, ou arrastar arquivos csv ou json.

Fonte dos dados:

Base de CNPJ está disponível em https://dados.gov.br/dados/conjuntos-dados/cadastro-nacional-da-pessoa-juridica-cnpj ou https://dadosabertos.rfb.gov.br/CNPJ/ (http://200.152.38.155/CNPJ/).
Arquivo CNPJ.db sqlite já tratado pelo projeto https://github.com/rictom/cnpj-sqlite está disponível em https://github.com/rictom/cnpj-sqlite#arquivo_sqlite. Eu tento atualizar esse arquivo mensalmente.
Baixe o arquivo CNPJ.7z e descompacte usando o 7zip (https://www.7-zip.org/download.html). O arquivo descompactado tem cerca de 25GB.

Outras referências:

Biblioteca em javascript para visualização:
https://github.com/anvaka/VivaGraphJS

Menu Contextual:
https://www.cssscript.com/beautiful-multi-level-context-menu-with-pure-javascript-and-css3/

Ícones:
https://www.flaticon.com
https://fontawesome.com

Histórico de versões

versão 0.9 (dezembro/2022)

  • Grande melhoria de desempenho (10X mais rápido!!!);
  • Utilizando tabelas temporárias em memória do sqlite3;
  • Inclusão de flag quando houver dados adicionais no cpf/cnpj;
  • SHIFT+D exibe sócios de empresas;
  • Exibição do CNAE Secundário;
  • Aba com dados de empresas no Excel em lista;
  • Nome Fantasia no tooltip;
  • Busca por nome mais flexível;
  • Alteração no sentido das setas;
  • Busca de empresa por Nome Fantasia;
  • Troca de fonte.
  • Observação: A partir desta versão, é necessário criar um arquivo rede.db para a rotina funcionar.

versão 0.8.8 (setembro/2022)

  • busca por Nome Fantasia de cnpj;
  • alteração no espaçamento dos botões para Android;
  • popup de mensagem inicial vai aparecer menos;
  • melhoria no visual do popup nos mapas;
  • remoção de caixa de entrada para perguntar a camada do item a ser inserido. Aperte uma tecla de 2 a 9 para inserir mais camadas;
  • clicar no botão camada, duplo-clique ou pressionar tecla 1 de forma repetida irá trazer mais camadas.

versão 0.8.7 (setembro/2022)

  • abre mapa com endereços das empresas no OpenStreetMap, pelo botão image no canto superior direito da tela:
    image
  • o parâmetro geocode_max em rede.ini define a quantidade de endereços que serão buscados pela api do OpenStreetMap. Para evitar bloqueio, é feito uma pausa de um segundo entre cada chamada da api. Se a quantidade de endereços for maior que o parâmetro geocode_max, os endereços dos cnpjs serão substituidos pelas coordenadas dos municipios de acordo com tabela do IBGE.
  • em cada popup de endereço, há quatro opções: a) abrir o endereço no Google Maps; b) abrir uma rede de relacionamentos do cnpj; c) exibir dados do cnpj; d) selecionar o item na rede original.

versão 0.8.6 (agosto/2022)

  • exportação para gráfico no formato (ex-IBM) i2 Chart Reader ou Analyst's Notebook (.anx), pela opção no menu Salvar/Abrir>Salvar i2...:
    image

  • O i2 Chart Reader pode ser baixado gratuitamente no site https://i2group.com/i2-chart-reader?hsLang=en

  • opção H para abrir árvore com links de busca na página do Google:image

  • opção SHIFT+H para abrir árvore com palavras chaves dos links da página do Google. Exemplo: chaves

  • para usar a opção SHIFT+H, deve-se instalar as bibliotecas pelo comando pip install -r requirements_chaves.txt
    e depois instalar os módulos do spacy pelos comandos python -m spacy download en_core_web_sm e python -m spacy download pt_core_news_lg. No arquivo rede.ini, modifique o parâmetro para busca_chaves = 1

  • Como a opção de chaves é lenta, ela não foi habilitada para rodar no servidor. Utilize com a versão local do projeto.

versão 0.8.5 (julho/2022)

  • visualização melhorada em celular Android;
  • alteração do script rede_relacionamentos.py para rede_sqlite_cnpj.py;
  • alteração do parâmetro gravidade, para diminuir a dispersão de grupos não conexos;
  • tutorial de instalação passo a passo.

versão 0.8.4 (junho/2022)

  • aceita CNPJs ou CPFs com zeros à esquerda faltando.

versão 0.8.3 (maio/2022)

  • inclusão de relacionamento de representante de sócio;
  • campo de busca de cpf/cnpj na linha do menu;
  • rotina cnpj_search.py para indexar coluna de razão social ou nome de sócio para busca por parte do nome.

versão 0.8.2 (janeiro/2022)

  • opção no menu Salvar/Abrir>Baixar base CNPJ para abrir a página com o arquivo em SQLITE;
  • tecla A - se houver só um item selecionado, abre um gráfico em nova aba no link /rede/grafico/NUMERO_CAMADA/PJ_X, cujo link poderá ser compartilhado;
  • usando somente POST em algumas consultas;
  • alerta de que consulta por CPF pode apresentar erros. A base da Receita só contem seis dígitos do CPF de sócios, por isso a busca exibe todos os CPFs que tem os mesmo dígitos;
  • flask-limiter para diminuir excesso de consultas. Se precisar dos dados por api, rode o projeto localmente e altere os parâmetros limiter_padrao e limiter_dados do arquivo de configuração rede.ini.

versão 0.7.4 (dezembro/2021)

versão 0.7.3 (setembro/2021)

  • correção de erro em ligação em banco de dados local.

versão 0.7.2 (setembro/2021)

  • opção para alterar o nome da aba;
  • opção para selecionar todos os itens;
  • opção para inverter seleção;

versão 0.7.1 (agosto/2021)

  • opção para dividir gráficos em outras abas (tecla Q);
  • correção de erro quando se apertava tecla CTRL;
  • opção para selecionar itens adjacentes aos selecionados (tecla J);
  • opção para selecionar árvore que contém o item (tecla SHIFT+J);
  • opção para listar itens com mais links (tecla CTRL+J)
  • opção para selecionar itens com mais ligações para ícones coloridos;
  • opção "Nova Aba" (tecla A) abre nova aba com mais de um item selecionado;
  • troca de nomes no menu de exportar json para salvar json;
  • opção para exportar dados para banco de dados local (só funciona na máquina local);
  • opção para exportar para json apenas itens selecionados;
  • opção para ocultar rótulos de ligações (SHIFT+N);
  • opção para remover todas as ligações dos itens selecionados;
  • opção simplifica gráfico (remove itens que não são coloridos ou com comentário que tem apenas uma ligação).

versão 0.6.3 (julho/2021)

  • melhoria para dar clique duplo em ícones;
  • correção de erro de ligação para empresa no exterior sem cnpj;
  • somente o ícone pode ser clicado;
  • mensagem de alerta para utilizar caractere curinga;
  • mudança nas tabelas temporárias;
  • todas as tabelas de códigos (cnae, natureza jurídica, etc) foram incorporados ao arquivo sqlite;
  • OBSERVAÇÃO. A versão 0.6.3 só vai funcionar com a versão mais atualizada do arquivo cnpj.db referência 16/7/2021.

versão 0.5.1 (junho/2021)

  • atualização da tabela sqlite cnpj.db com dados públicos de 18/06/2021.

versão 0.5 (abril/2021)

  • alteração do código para layout novo das tabelas;
  • busca por Radical de CNPJ ou CPF de sócio (busca somente pelo miolo do CPF);

versão 0.4 (janeiro/2021)

  • usando lock para evitar erro de consulta em requisições simultâneas;
  • opção para fazer busca do termo no Portal da Transparência da CGU;
  • correção de link para google search.

versão 0.3.4 (janeiro/2021)

  • Possibilita ver o texto do lado direito do ícone;
  • diagramas de tabela hierárquica;
  • ver diagramas de arquivo com código em python;
  • mais opções por linha de comando.

versão 0.3 (janeiro/2021)

  • Opção para inserção de novos itens para elaboração de mapas mentais;
  • Opções para inserir itens novos como link para sites e arquivos locais.
  • Opção para arrastar células do excel, leitura de arquivo csv;
  • Opções de leitura de entrada por linha de comando;
  • Itens selecionados ficam em destaque com linha animada;
  • Alteração no formato do arquivo de configuração rede.ini.

versão 0.2 (dezembro/2020)

  • Suporte para busca por parte do nome na base de empresas;
  • Exportação/importação de gráfico no formato json para o servidor.

versão 0.1 (setembro/2020)

  • Primeira versão