本仓库记录寒假在小牛翻译实验室编写的一些程序
构造带标签的双语语料
- Linux
- Python >= 3.6
- torch >= 1.3.0
- torchvision >= 0.4.2
- PyNLPIR
- perl
首先编辑 main.sh
, 配置好文件
chmod +x main.sh
./main.sh -l <protection> -m <model>
<protection> 只能是 'no' 'tok' 'bpe'中的一种
<model> 只能是 0 或 1 或 2
0 : 不泛化
1 : 标签两端加$copy
2 : 完全泛化
举例
./main.sh -l bpe -m 1