jcsun-00/KeAGN

Knowledge-enriched and Attention Guided Network, which is used for event causality identification.

Python

知识驱动的事件因果关系识别

KeAGN模型全称为Knowledge-enriched and Attention Guided Network，即富知识化与注意力引导网络
KeAGN模型由本人在毕业论文中提出，其主要应用于NLP领域中的句级因果关系识别
KeAGN模型改进自LSIN模型，LSIN模型详情可见Knowledge-Enriched Event Causality Identification via Latent Structure Induction Networks

Step 0: 准备数据

下载数据集 (建议略过该步, 直接进行[2]和Step 3)
EventStoryLine
Causal-TimeBank
下载论文作者使用的数据 (包含数据集、零跳概念匹配数据、ConceptNet数据、COMET生成数据)
全部数据(Google Drive)
解压覆盖
步骤[1]-->解压文件夹, 将数据集复制到data文件夹下
步骤[2]-->解压文件夹至项目文件夹下，覆盖原来的data文件夹

PS: 完成[2]之后可以直接进行Step 3

Step 1: 从XML文件中提取数据

python read_document_ESC.py
python read_document_CTB.py

Step 2: 知识引入

python preprocess.py

PS: 文件中的seed用于修改随机数种子, ds用于修改要处理的数据集

Step 3: 模型训练及评估

训练之前需要在config.py文件中配置相关信息
配置完成后运行train.sh，示例及备注如下：

./train.sh KeAGN_epoch15 me

KeAGN为输出文件名, 可自行修改, shell文件会自动补充后缀.log
me为实验方式, 可修改为ESC或CTB
me表示多次实验求平均值, 实验数据集
ESC表示在EventStoryLine数据集上进行单次实验
CTB表示在Causal-TimeBank数据集上进行单次实验