Modelo Random Forest com Linguagem de Processamento Natural
Motivado com as sequencias de estudos do projeto de triagem de perícias, estabeleceu-se que seria necessário atualizar o conjunto de dados de processos do CRETA usados até então. Contudo, foi identificado que as querys de extração dos dados precisavam ser revisadas e refatoradas para posteriormente realizar a extração de dados de julho de 2019 à fevereiro de 2022. Durante essa extração, tomou-se como premissa o hábito observado de que, durante a tramitação de uma ação judicial, o primeiro documento inserido corresponde à petição inicial. Com o intuito de validar essa ideia, foram elaborados testes em uma amostra de dados selecionados aleatoriamente. Diante da proporção insatisfatória de processos que apresentaram o primeiro documento como petição inicial, decidiu-se que a premissa deve ser alterada. Diante disto, esse projeto nasce com o objetivo de corrigir essa classificação de documentos, onde a partir do texto extraído de documentos da base do CRETA/RN visa criar um classificador binário que vai responder se aquele documento é ou não uma petição inicial.
Trabalho desenvolvido no Programa de Residência em Tecnologia da Informação do Instituto Metrópole Digital da Universidade Federal do Rio Grande do Norte como requisito de avaliação da disciplina IMD0390 - APRENDIZADO DE MÁQUINA
COMPONENTES: Matheus de Andrade, Ney Pimentel T. de Oliveira e Patrícia Sayonara G. de Araújo
PROFESSOR: Dr. Daniel Sabino Amorim de Araújo