使用 pCLUE-main 项目里面的datasets里面的120万数据训练后,效果不佳

Question

使用 pCLUE-main 项目里面的datasets里面的120万数据训练后,效果不佳

yzhzx opened this issue a year ago · 1 comments

使用pCLUE-main项目里的数据训练后, 加载模型 , 同样的代码 , 使用本地训练的和示例代码出来的结果完全不同 , 请问需要怎么改进
示例代码
tokenizer = T5Tokenizer.from_pretrained("ClueAI/PromptCLUE")
model = T5ForConditionalGeneration.from_pretrained("ClueAI/PromptCLUE")
print(answer('''信息抽取：
今天我向大家介绍一下一个人。他是张丰毅1956年9月1日出生于河南省南阳市唐河县，1982年毕业于北京电影学院，是**电影协会理事。1993年，与其他演员主演电影《霸王别姬》
问题：主角，嘉宾，演员，改编自，面积，出生地，学校，成员，出生时间
答案：''',sample=False))

输出结果:
地址：河南省南阳市唐河县
组织：北京电影学院，**电影协会
名字：张丰毅
职位：理事

本地模型
tokenizer = T5Tokenizer.from_pretrained("ClueAI/PromptCLUE")
model = T5ForConditionalGeneration.from_pretrained("outputs/model_files/")
#或者以下方式引用
tokenizer = AutoTokenizer.from_pretrained("ClueAI/PromptCLUE")
model = AutoModelForSeq2SeqLM.from_pretrained("outputs/model_files/")
print(answer('''信息抽取：
今天我向大家介绍一下一个人。他是张丰毅1956年9月1日出生于河南省南阳市唐河县，1982年毕业于北京电影学院，是**电影协会理事。1993年，与其他演员主演电影《霸王别姬》
问题：主角，嘉宾，演员，改编自，面积，出生地，学校，成员，出生时间
答案：''',sample=False))
输出结果:
演员：张丰毅1956年9月1日出生于河南省南阳市唐河县

Answer 1 · 2023-06-06T03:29:40.000Z

训练过程是按照 ClueAI/pCLUE-main/Fine_tunining_PyTorch.ipynb 进行的 , 本地显存不足使用
"TRAIN_BATCH_SIZE": 4, # training batch size, 8
"VALID_BATCH_SIZE": 4, # validation batch size,8
参数进行的