/chatpdf

Primary LanguagePython

ChatPDF

Introdução

Este projeto é uma demonstração de como usar a biblioteca Langchain para realizar perguntas e respostas em um documento PDF. O Langchain é uma biblioteca que fornece diversas ferramentas de processamento de linguagem natural, como incorporação de texto, busca de vetores e perguntas e respostas.

Esse projeto é uma adaptação do Notebook do youtuber Prompt Engineering: link para o notebook original

Configuração

Para executar este projeto, você precisará seguir estas etapas:

  1. Clone o repositório.
  2. Instale os pacotes necessários executando
pip install -r requirements.txt

(Eu recomendo a criação de um ambiente virtual)

  1. Crie um arquivo chamado env.json no diretório raiz do projeto com sua chave de API do OpenAI. O modelo do arquivo está no arquivo env.sample.json
  2. Baixe um documento PDF de exemplo e salve-o na pasta pdf do projeto. O código espera que o nome do arquivo seja sample.pdf.
  3. Execute o arquivo main.py usando
python main.py

Como o processo funciona

O canal Prompt Engineering explica passo a passo a arquitetura e o processo. Recomendo que assista esse vídeo