/EXCGEC

Primary LanguagePython

EXCGEC

时间规划表

描述 描述
数据集构建 2024.03-2024.04 GPT-4 合成数据、人工筛选 ☑️
联合模型开发(训练、解码) 2024.04.18-2024.05.02 训练算法 ☑️
2024.05.02-2024.05.16 解码算法 ☑️
评估度量开发 2024.05.10 - 2024.05.16 ing
Benchmark 设计和实验 2024.05.10 - 2024.05.16 设计评估指标 ing
论文撰写 2024.06.01

更新

  • 2024.05.05:完成联合模型的训练代码开发
  • 2024.05.16:完成联合模型的解码代码开发(Qwen1.5 - top-p)

微调

脚本: LLaMA-Factory-main/multi_lora_qwen.sh

工作日志

代码部分:

  1. 实现解释单任务,用于对解释信息进行评估 实现:decode解码端,提供out和edits,只解释->(解释评估
  2. 新增模型:llama 3- 7B
  3. 目前为 lora 微调策略

评估部分:

  1. 数据集划分
  2. Benchmark设置