/attention_is_all_you_need_transformer

Chinese-english translation based on Transformer

Primary LanguagePython

论文来源

Attention is all you need

代码参考

哈弗 nlp

项目结构

  • data 源数据目录
  • log 日志存放目录 (每次预测产生一个 log-timestamp.txt)
  • save 模型存放目录
  • model 模型目录
    • attention.py
    • embedding.py
    • encoder.py
    • decoder.py
    • generator.py
    • sublayer.py
    • position_wise_feedforward.py
    • transformer.py
  • lib 损失函数、优化器等存放位置
    • criterion.py 损失函数
    • optimizer.py 优化器
    • loss.py 优化器 + 损失函数封装类
  • evaluate.py 预测.py
  • train.py 训练.py
  • parser.py 参数.py
  • utils.py 工具类.py
  • run.py 入口文件.py
  • README.md readme

训练

python3 run.py

预测 (前提:训练过)

python3 run.py --type evaluate