/My-Competition

All the projects of my own about the competition. \ 参加的比赛及项目代码和描述文件

Primary LanguagePython

My-Competition

一些比赛项目的代码

比赛详情见达观杯文本智能处理挑战赛

(非比赛期间参加的)

  • 提交时间: 2019-04-28 23:09
  • 最高得分:0.7946
  • 最高排名:线上A榜23名
  • 项目简介:
    1.19个类别的长文本分类问题,共十万条脱敏的训练数据以及十万条测试数据,平均每篇文章有1170个字,719个词;
    2.将所有脱敏的数据作为语料进行词向量word2vec预训练;根据现有的文本分类模型,设计和搭建了7种不同模型,分别有GRU、LSTM、RCNN、TextCNN、FastText以及分别加入attention的GRU、LSTM模型;
    3.对所有模型以及不同特征进行实验调整,最终采用概率等权重的模型融合策略,对训练的14个单个模型进行融合,最终取得了0.79476的F1得分,排名23名。