- Esse código foi utilizado para buscar similaridadee em colunas com objetivo de padronizar uma base de dados.
- Aplicar .apply e trabalhar com matriz de vetores a fim de aumentar escalabilidade.
- Aumentar o número de colunas similares, a do algoritmo funciona como uma árvore de decisão
Antes de começar, certifique-se de ter o seguinte instalado em sua máquina:
- Python 3.10.12
- pip (gerenciador de pacotes Python)
- Git (ferramenta de controle de versão)
Uma vez que você tenha isso instalado, abra um terminal em sua máquina local e execute os seguintes comandos:
-
Clone o repositório:
git clone https://github.com/bAlemar/Similaridade-de-Colunas.git
-
Navegue até o diretório do repositório clonado:
cd Similaridade-de-Colunas
-
Crie um ambiente virtual:
python -m venv ambiente_virtual
-
Ative o ambiente virtual:
4.1 Linux
source ambiente_virtual/bin/activate
4.2 Windows
ambiente_virtual\Scripts\activate
-
Instale as Dependências:
- Instale de acordo com Dashboard que deseja utilizar.
pip install -r requeriments.txt