/pseudonimizacao

Este é um script que utiliza o Spacy para identificar entidades nomeadas em um texto em português e, em seguida, substitui essas entidades por caracteres de pseudônimo.

Primary LanguagePython

Pseudonimizador de Dados Pessoais

Este é um pequeno script em Python que utiliza a biblioteca Spacy para identificar entidades nomeadas em um texto em português e, em seguida, substitui essas entidades por caracteres de pseudônimo.

O objetivo é proteger a privacidade das informações pessoais presentes no texto, como nomes de pessoas, localizações, números de telefone e endereços de e-mail.

Funcionalidades

  • Identificação de entidades nomeadas como pessoas (PER) e locais (LOC) no texto.

  • Ocultação de nomes de pessoas e localizações substituindo-os por caracteres de pseudônimo (#).

  • Remoção de números de telefone e endereços de e-mail substituindo-os por caracteres de pseudônimo (#).

Referência

Medium - Demystifying Individual Privacy