liu-hz18@mails.tsinghua.edu.cn
衡量标准: Acc, F1(macro)
Model | Test-Acc |
---|---|
MLP | 56.64 |
BERT-MLP | 60.33 |
CNN | 58.86 |
Text-CNN | 62.72 |
RNN | 55.09 |
LSTM | 61.16 |
GRU | 62.64 |
提交的包中已经包含了预处理后的文件,可以直接训练。
如果您需要从头开始预处理数据(非必需), 您需要下载Word2Vec
词向量文件sgns.sogounews.bigram-char
,您可以从我的云盘
https://cloud.tsinghua.edu.cn/f/cb435184e9ed41979d49/
中下载,放入/word2vec/
文件夹下之后开始预处理过程。
之后您可以在命令行输入
python main.py pre
来进行预处理工作。
命令行中输入一种模型名称即可开始训练。
python main.py mlp|cnn|rnn|textcnn|rcnn|bert (选一个)
可以训练相应的神经网络. main.py
中针对不同网络设置了对应模型的参数,您可以根据需要修改相关参数.
均保存在/save/...
中对应的文件夹下.
输出包括:
参数配置config.json
、训练日志*.log
、模型参数*.pkl
、
模型可视化结构*.pdf
、使用TensorBoard
可视化的Scalar
曲线events.out.tfevents.xxx
等文件。
您可以在最上层文件夹下执行命令
tensorboard ‐‐logdir save/...
来查看acc, loss, F1, corr
等scalar
变化的曲线.
特别地,如果您想查看所有模型的可视化结果,请执行命令
tensorboard ‐‐logdir save/all/run
之后在http://localhost:6006/ 中查看结果。