/open_tax

Lakehouse Tributário, para apoio gerencial aos processos fiscais, visando a melhoria contínua, identificação de falhas (Tax Compliance), modelos inteligentes de identificação de oportunidades (Tax Intelligence) e democratização das informações fiscais.

Primary LanguagePython

Motivador do Projeto

Devido ao vasto número atual de tributos (mais de 70 impostos diferentes no Brasil), a complexidade da Legislação Tributária (Municipal, Estadual e Federal), a velocidade das mudanças (alterações de alíquotas, isenções, reformas, …), aos volume de dados (Notas FIscais mensais, p.ex), a operacionalização do recolhimentos e das obrigações acessórias; tal tema ("Gestão Tributária") tem ampla relevância no mundo corporativo. Ou seja, temos os famosos cinco "V's" (Velocidade, Variedade, Volume, Veracidade e Valor), e que nos submete, de forma adequada, aos projetos de Big Data e Data Lake.

Potenciais Benefícios

A criação de um ambiente gerencial, com um repositório único, simples e centralizado, contendo todas as informações do universo Tributário (Notas Fiscais de Entrada e Saída, Tabelas de Apoio, Interfaces do ERP, informações do Fisco, etc); onde possamos democratizar a informação e facilmente cruzar os dados, gerar relatórios, insights e projeções; potencializa a eficiência e a eficácia dos processos Tributários.

A proposta é a criação de um ambiente complementar aos Sistemas transacionais que operam no cálculo e envio das interfaces fiscais.
A ideia do "Data Lake" Tributário é proporcionar a melhoria contínua de processos fiscais, além de identificar eventuais falhas, através da fácil manipulação de dados em larga escala, utilizando também modelos preditivos de aprendizado de máquina (Machine Learning) para identificar oportunidades e anomalias.

Potenciais Ganhos

  • Redução da exposição fiscal devido a falhas de tributação
  • Identificação de Oportunidades de Crédito Tributário
  • Visibilidade Gerencial - Projeções de Recolhimento
  • Melhoria de processos fiscais e categorização de operações fiscais
  • Agilidade na auditoria e atendimento ao Fisco
  • Apoio gerencial no Planejamento Tributário

Arquitetura

Por que o Databricks Lakehouse?

A plataforma Databricks proporciona justamente esse ambiente: SIMPLES e COLABORATIVO.

O conceito de LAKEHOUSE visa proporcionar duas abordagens diferentes para manipulação e armazenamento de dados:

  1. Data Lake: um repositório de armazenamente de baixo custo e escalável, para armazenar uma grande volumetria de dados, além de possibilitar a ingestão de dados estruturados e não estruturados na mesma plataforma. E disponibilizando também funcionalidades para manipulação e aplicação de Modelos Preditivos.

  2. Data Warehouse: um repositório com dados tratados para uso de ferramentas analíticas de mercado (PowerBI, Tableau, Excel, etc.).


Ou seja, Databricks LAKEHOUSE = Data Lake + Data Warehouse