Modul ini dirancang untuk menyederhanakan dan mempercepat proses pembuatan ringkasan dan Risalah Rapat (MoM) menggunakan teknik pemrosesan bahasa alami tingkat lanjut, khususnya memanfaatkan pustaka Gensim. Baik Anda menangani dokumen berukuran besar atau transkrip rapat, perpustakaan ini memberikan solusi cepat dan efisien untuk menyaring informasi penting.
python SummerizeMoM/main.py --file "<your_file>.rtf"
atau jika ingin mengubah nama file hasil summary atau MoM dapat menggunakan perintah ini:
python SummerizeMoM/main.py --file "<your_file>.rtf" --summary "<file_summary>.txt" --MoM "<file_MoM>.txt"
[help]
usage: main.py [-h] --file FILE [--summary [SUMMARY]] [--MoM [MOM]]
Create MoM with LLM Model
options:
-h, --help show this help message and exit
--file FILE file .RTF path to create the MoM file
--summary [SUMMARY] Name file for summary
--MoM [MOM] Name file for MoM
virtualenv venv
source venv/bin/activate
python setup.py
Modul ini melakukan summery menggunakan gensim dengan versi v3.8. Dikarenakan library gensim hanya mensupport summary pada versi < v4.0.0. sehingga perlu melakukan configurasi mengenai library modul dapat kompatible dengan gensim.
ubah import collection Mapping menjadi collection.abc pada file env/lib/python3.10/site-packages/gensim/corpora/dictionary.py
.
before
from collections import Mapping, defaultdict
after
from collections import defaultdict
from collections.abc import Mapping
kemudain ubah collection iterable menjadi collection.abc pada file venv/lib/python3.10/site-packages/gensim/models/doc2vec.py
.
before
from collections import namedtuple, defaultdict, Iterable
after
from collections import namedtuple, defaultdict
from collections.abc import Iterable
kemudain ubah collection iterable menjadi collection.abc pada file /venv/lib/python3.10/site-packages/gensim/models/fasttext.py
.
before
from collections import Iterable
after
from collections.abc import Iterable
anda dapat mengganti model dan mengatur configurasi dari llm pada file SummerizeMoM/config.yaml
. ini adalah configurasi llm saat ini.
model: "TheBloke/vicuna-7B-v1.5-GPTQ"
config:
max_new_tokens: 1024
temperature: 0.2
top_p: 0.1
repetition_penalty: 1.1