描述 | 描述 | ||
---|---|---|---|
数据集构建 | 2024.03-2024.04 | GPT-4 合成数据、人工筛选 | ☑️ |
联合模型开发(训练、解码) | 2024.04.18-2024.05.02 | 训练算法 | ☑️ |
2024.05.02-2024.05.16 | 解码算法 | ☑️ | |
评估度量开发 | 2024.05.10 - 2024.05.16 | ing | |
Benchmark 设计和实验 | 2024.05.10 - 2024.05.16 | 设计评估指标 | ing |
论文撰写 | 2024.06.01 | ||
- 2024.05.05:完成联合模型的训练代码开发
- 2024.05.16:完成联合模型的解码代码开发(Qwen1.5 - top-p)
脚本: LLaMA-Factory-main/multi_lora_qwen.sh
- 实现解释单任务,用于对解释信息进行评估 实现:decode解码端,提供out和edits,只解释->(解释评估
- 新增模型:llama 3- 7B
- 目前为 lora 微调策略
- 数据集划分
- Benchmark设置