/ATEC-NLP

蚂蚁金服比赛 15th/2632

Primary LanguagePython

ATEC-NLP

蚂蚁金服比赛 15th/2632

ATEC比赛是一次让人难忘的比赛,经常看到其他的小伙伴频频上分给自己带来的压力。这对我来说也是一次难得的学习机会,同时也有幸跟很多知名大佬同台竞技,其中的乐趣到现在还怀念。希望有机会能再遇到那些人,再比一次。

比赛的总结写在了博客中 https://blog.csdn.net/cuihuijun1hao/article/details/82318792

目录中的代码很多都是我的尝试代码,以下是各个代码的数据表现

初赛模型 线下F1 分数 线上提交
CharAndPinyin.py 0.52 未尝试
CharAndWord.py 0.55 0.638(融合)
RnnCnn.py 0.53 0.61
DSSM.py 0.33 0.41
xgboost_main.py 0.27 未尝试
复赛模型 测试集分数 线上提交
Siamese+传统特征 0.698 0.7008
复赛模型(DecomposeAtteintion) 测试集分数 线上提交
cnn-da.py 0.683 未尝试
decomChar.py 0.685 未尝试
decomWordChar.py 0.688 0.7006(单模型)
unique.py 0.682 未尝试
unique-cnn.py 0.685 未尝试

注意:DRCN模型测试集分数是从初赛数据中随机挑出3万个数据进行的实验,因为那个时候比赛时 间不多了,线上排队时间太长,所以拿小数据进行了实验。

复赛模型(DRCN) 测试集分数 线上提交(A榜) 线上提交(B榜)
2layer.py 0.591 0.7129(单模型) 0.7218(模型融合)
AE.py 不收敛 未尝试 未尝试
cos-atten.py 0.564 未尝试 未尝试
GRU.py 无记录,但是记得效果不好 未尝试 未尝试
WordChar.py 0.582 0.7086 未尝试
WordEmbFixed.py 0.546 未尝试 未尝试

注意: 这次比赛中,并没有给ESIM模型足够的重视,就跑了一次就没再调,后来知道其他队伍都是靠这个模型上分的,心里也是比较遗憾。所用的数据也是初赛数据随机挑出的3万条

复赛模型(ESIM) 测试集分数
esim.py 0.56

注意:DIIN 模型比赛最后一天写的,对应分数都线上训练数据测试集数据。

复赛模型(DIIN) 线上测试集分数
char.py 0.71
fusegate.py 0.64
SelfAtten.py 0.68
模型融合 测试集分数 提交分数
Siamese 传统特征 + Descompose Atten Word Char + DRCN Word + DRCN Char 0.7152 未尝试
Decompose Attention Word Char + DRCN Word + DRCN Char 0.7173 未尝试
DRCN Word+DRCN Char + DIIN Char 0.7242 0.733(最终分数)
DRCN Word+DRCN Char + DIIN Char + Decompose Attention + Siamese 传统特征 未尝试(没来得及) 未尝试