THUKElab/EXCGEC

Python

EXCGEC

时间规划表

	描述	描述
数据集构建	2024.03-2024.04	GPT-4 合成数据、人工筛选	☑️
联合模型开发（训练、解码）	2024.04.18-2024.05.02	训练算法	☑️
	2024.05.02-2024.05.16	解码算法	☑️
评估度量开发	2024.05.10 - 2024.05.16		ing
Benchmark 设计和实验	2024.05.10 - 2024.05.16	设计评估指标	ing
论文撰写	2024.06.01

更新

2024.05.05：完成联合模型的训练代码开发
2024.05.16：完成联合模型的解码代码开发(Qwen1.5 - top-p)

微调

脚本： LLaMA-Factory-main/multi_lora_qwen.sh

工作日志

代码部分：

实现解释单任务，用于对解释信息进行评估实现：decode解码端，提供out和edits，只解释->（解释评估
新增模型：llama 3- 7B
目前为 lora 微调策略

评估部分：

数据集划分
Benchmark设置