Este é o repositório do projeto final da disciplina Tecnologias de Big Data do curso de pós-graduação em Ciência de Dados do Instituto Federal de São Paulo - Campus Campinas. O projeto propõe o desenvolvimento de uma solução completa (end-to-end) de dados usando ferramentas da AWS.
Tema do projeto: Engenharia de dados no apoio à tomada de decisão em processo de inventário.
Alunos: Lucas da Silva Lima (CP3021882) e Ridley Gadelha de Sousa (CP3021921)
Requisitos de projeto: Descrição dos requisitos
O processo de inventário é um dos pilares da cadeia logística, pois permite com que as empresas tenham um controle efetivo sobre seus estoques, identificando possíveis perdas e garantindo uma boa saúde dos ativos. Para auxiliar neste processo, é notória a importância da utilização de dados para uma melhor tomada decisão, uma vez que permite com que as empresas tenham uma visão mais clara e precisa de sua operação, identificando pontos de melhoria e oportunidades de otimização.
O inventário logístico abrange diversas etapas, desde o planejamento até a execução das atividades de contagem física. Inicialmente, é imperativo realizar uma análise criteriosa dos produtos a serem inventariados, levando em consideração fatores como sazonalidade, demanda histórica e características específicas de cada item. A definição de estratégias de contagem, como a classificação ABC para priorização de itens de maior relevância, é uma prática comum nesse estágio preparatório.
A execução do inventário logístico demanda a aplicação de métodos e tecnologias apropriados. A utilização de códigos de barras, sistemas de identificação por radiofrequência (RFID) e softwares de gestão de estoque desempenha um papel crucial na precisão e eficiência do processo. A integração dessas tecnologias permite a automação de tarefas, reduzindo erros manuais e otimizando o tempo despendido na contagem.
A etapa de contagem propriamente dita requer a mobilização de recursos humanos e materiais de maneira coordenada. A realização de auditorias cruzadas, envolvendo múltiplos contadores, é uma prática recomendada para mitigar possíveis discrepâncias e assegurar resultados confiáveis. Além disso, o registro preciso de dados, juntamente com a reconciliação entre os registros físicos e sistêmicos, é essencial para a obtenção de uma visão acurada do estoque.
A revolução das ferramentas de nuvem tem sido um fator chave na transformação digital das empresas, permitindo que elas acessem serviços computacionais de forma mais ágil e eficiente, reduzindo custos e aumentando a eficiência operacional.Neste trabalho acadêmico, exploraremos a importância do processo de inventário dentro da cadeia logística, a importância da utilização de dados logísticos para a tomada de decisão e a revolução das ferramentas de nuvem na utilização de serviços computacionais, destacando as principais tendências e desafios enfrentados pelas empresas na era digital. Dessa forma, as empresas podem armazenar e processar grandes volumes de dados logísticos de forma mais eficiente e segura, permitindo que elas tenham uma visão mais clara e precisa de sua operação.
A Amazon Web Services (AWS) é uma plataforma de computação em nuvem que oferece uma ampla variedade de serviços globais baseados em nuvem, incluindo computação, armazenamento, bancos de dados, análise, redes, dispositivos móveis, ferramentas de desenvolvimento, ferramentas de gerenciamento, IoT, segurança e aplicativos empresariais. A AWS fornece mais de 200 serviços, como data warehousing, ferramentas de implantação, diretórios e entrega de conteúdo, que podem ser provisionados rapidamente, sem despesas de capital inicial, permitindo que empresas de todos os tamanhos tenham acesso aos componentes básicos necessários para atender rapidamente às necessidades dinâmicas dos negócios 1
Este estudo tem como objetivo empregar um caso logístico real como cenário para a aplicação prática dos métodos e recursos da Amazon Web Services (AWS) apresentados durante as aulas. Busca-se, assim, a oportunidade de efetivar e utilizar, de maneira concreta, as funcionalidades desta ferramenta no contexto logístico. Este enfoque prático proporciona uma aplicação tangível dos conhecimentos teóricos adquiridos em sala de aula, enriquecendo a compreensão dos conceitos abordados e fornecendo insights valiosos sobre a eficácia da AWS em situações do mundo real. Essa abordagem, fundamentada na interseção entre a teoria e a prática, almeja aprimorar a capacidade dos participantes em traduzir o conhecimento acadêmico em soluções efetivas para desafios logísticos reais.
Os dados utilizados no projeto são dados reais, em ambiente de produção de uma companhia logística localizada em São Paulo. Todos os dados estão em conformidade com a Lei Geral de Proteção de Dados (LGPD), que estabelece regras sobre coleta, armazenamento, tratamento e compartilhamento de dados pessoais, inclusive na internet 2. Além disso a companhia em questão tomou os devidos cuidados para não expor nenhum dado confidencial estratégico do estoque.
1. CBA030.csv: Esta é a base principal do projeto. Trata-se de uma tabela utilizada como mestre de inventário. Trata-se de uma tabela com 88769 registros. A tabela a seguir, indica a relação das colunas presentes na tabela CBA030.
Campo | Título | Descrição |
---|---|---|
CBA_FILIAL | Filial | Filial |
CBA_CODINV | Cod.Invent. | Código do inventario |
CBA_ANALIS | Análise | Análise |
CBA_DATA | Data | Data |
CBA_CONTS | Contagens | Contagens a realizar |
CBA_LOCAL | Almoxarifado | Almoxarifado |
CBA_TIPINV | Tipo | Tipo do Inventário |
CBA_LOCALI | Endereco | Endereço |
CBA_PROD | Produto | Código de Produto |
CBA_CONTR | Cont. Realiz | Contagens Realizadas |
CBA_STATUS | Status | Status de contagem |
CBA_AUTREC | Recontagem | Autoriza Recontagem |
CBA_CLASSA | Classe A | Classe A da Curva ABC |
CBA_CLASSB | Classe B | Classe B da Curva ABC |
CBA_CLASSC | Classe C | Classe C da Curva ABC |
CBA_INVGUI | Inv. Guiado | Inventário Guiado |
CBA_RECINV | Rec. Inv Mob | Recebimento inventario Mobile |
CBA_DISPOS | Dispositivo | Dipositivo para coleta |
2. CBB030.csv: Cabeçalho de Inventário. Nesta tabela é possível consultar quais usuários realizaram cada uma das contagens e o status de cada uma. A Tabela a seguir indica os campos e suas respectivas descrições, presentes nesta tabela.
Campo | Título | Descrição |
---|---|---|
CBB_FILIAL | Filial | Filial |
CBB_NUM | Número | Número do cabeçalho |
CBB_CODINV | Codigo Inv. | Código do inventario |
CBB_USU | Usuário | Código de usuário |
CBB_NCONT | Nr. contagem | Número da contagem |
CBB_STATUS | Status | Status da contagem |
3. CBC030.csv: Itens de Inventário. Esta é a tabela complementar à tabela CBB030. Com ela, é possível obter mais detalhes em cada uma das contagens realizadas pelos usuários como por exemplo a quantidade que foi efetivamente contada por cada um dos usuários, o produto que estava naquele endereço e também o lote do produto. A Tabela a seguir indica os campos e suas respectivas descrições, presentes nesta tabela.
Campo | Título | Descrição |
---|---|---|
CBC_FILIAL | Filial | Filial |
CBC_CODINV | Cod.Invent. | Código do inventario |
CBC_NUM | Número | Número do cabeçalho |
CBC_COD | Produto | Código de Produto |
CBC_LOCAL | Armazem | Código de Armazém |
CBC_QUANT | Quantidade | Quantidade contada |
CBC_QTDORI | Qtd.Original | Quantidade Original |
CBC_LOCALI | Endereco | Endereço |
CBC_LOTECT | Lote | Lote |
CBC_NUMLOT | Sub-lote | Sub-lote |
CBC_NUMSER | Num. serie | Número de série |
CBC_CODETI | Etiqueta | Código de etiqueta |
CBC_CONTOK | Contagem OK | Contagem Ok |
CBC_AJUST | Ajustado | Ajustado |
CBC_AJUST | ID Unitiz | ID do Unitizado |
CBC_CODUNI | Tipo Unitiz | Tipo do Unitizado |
4. Usuários.csv: Tabela Dimensão com informações complementares como o nome dos usuários que realizaram as contagens. A Tabela a seguir indica os campos e suas respectivas descrições, presentes nesta tabela.
Campo | Título | Descrição |
---|---|---|
USR_ID | ID de usuário | ID de usuário |
USR_CODIGO | Código de usuário | Código sistêmico |
USR_NOME | Nome Usr | Nome de usuário |
A tabela abaixo indica todos os relacionamentos que podem ser realizados entre as tabelas referenciadas acima, bem como quais as chaves utilizadas em cada relacionamento.
Tabela Origem | Tabela Destino | Chave Origem | Chave Destino | Cardinalidade |
---|---|---|---|---|
CBA (Mestre de inventario) | CBB (Cabecalho do inventario) | CBA_CODINV | CBB_CODINV | 1 para N |
CBB (Cabecalho do inventario) | Usuários | CBB_USU | USR_ID | N para 1 |
CBB (Cabecalho do inventario) | CBC (Itens do inventario) | CBB_NUM | CBC+NUM | 1 para N |
A imagem a seguir indica os recursos da AWS que foram utilizados, bem como a ordem de execução de cada um deles.
Diante da análise aprofundada sobre as ferramentas oferecidas pela Amazon Web Services (AWS) para a resolução de desafios na área de engenharia de dados, é evidente que esta plataforma se destaca como uma escolha robusta e completa para a implementação de soluções em projetos dessa natureza. Ao longo desta pesquisa, foi possível constatar a amplitude e eficácia das ferramentas disponíveis na AWS, as quais se mostraram capazes de lidar com a complexidade inerente à engenharia de dados.
Um dos aspectos mais notáveis é a acessibilidade proporcionada pela AWS, que permite a execução de tarefas complexas sem a necessidade de um conhecimento extremamente detalhado. Isso se revela como uma vantagem significativa, pois democratiza o acesso a tecnologias avançadas, possibilitando que profissionais de diferentes níveis de expertise possam aproveitar plenamente os recursos oferecidos pela plataforma.
No contexto específico de um problema relacionado a um processo logístico, a AWS demonstrou ser uma ferramenta não apenas robusta, mas também altamente performática. A extração e transformação dos dados do projeto foram realizadas de maneira eficiente, atendendo às demandas específicas do cenário logístico. Essa capacidade de adaptação e eficácia no enfrentamento de desafios práticos reforça a posição da AWS como uma escolha sólida para profissionais e organizações que buscam soluções confiáveis na área de engenharia de dados.