definition-modeling
- 首先将GoogleNews-vectors-negative300.bin文件放在data/word2vec文件夹下,运行utils文件夹下preprocess.py进行数据预处理。运行成功会在data/processed文件夹下生成处理好的文件。
- CUDA_VISIBLE_DEVICES= python train.py -–cuda进行训练。模型参数可在train.py里进行修改。每次会保存最好的模型在checkpoints文件夹下。
- Generate.py在gen文件夹下生成测试集的定义。
- Eval文件夹下的bleu.py进行BLEU的测试。
之前数据格式:
<s>measuring instrument designed to measure power<s/>
被定义词dynamometer的embedding作为rnn的 intial hidden state。
现在数据格式:
dynamometer<def>measuring instrument designed to measure power<s/>
将被定义词放在定义序列开头,rnn的 intial hidden state置0。
之前的结果:
Paper(PPL)) | Me(PPL) | Paper(BLEU) | Me(BLEU) | |
---|---|---|---|---|
Seed | 56.350 | 58.041 | 30.46 | 37.03 |
S+I | 57.372 | 60.762 | 31.58 | 37.76 |
S+H | 58.147 | 62.517 | 29.66 | 38.27 |
S+G | 50.949 | 57.414 | 34.72 | 37.03 |
S+G+CH | 48.566 | 56.512 | 35.78 | 37.66 |
S+G+CH+HE | 48.168 | 56.762 | 35.28 | 34.68 |
现在的结果:
Paper(PPL)) | Me(PPL) | Paper(BLEU) | Me(BLEU) | |
---|---|---|---|---|
Seed | 56.350 | 34.55 | 30.46 | 34.20 |
S+I | 57.372 | 35.64 | 31.58 | 34.59 |
S+H | 58.147 | 38.32 | 29.66 | 35.82 |
S+G | 50.949 | 34.16 | 34.72 | 37.84 |
S+G+CH | 48.566 | 34.23 | 35.78 | 36.22 |
S+G+CH+HE | 48.168 | 35.42 | 35.28 | 33.58 |
2018.11.03