ChatGLM-Instruct-Tuning

基于清华的 ChatGLM-6B + Alpaca 方式进行finetune.

准备

pip install -r requirements.txt

cd data
git clone https://github.com/carbonz0/alpaca-chinese-dataset

转化alpaca数据集为按行存储的Intruct格式数据

python cover_alpaca2jsonl.py

然后把数据划分为train.txt和valid.txt，保存在 ./data/example/路径下

bash scripts/finetune.sh

python infer.py