/2021-shandong-rizhao-baseline

2021山东省数据竞赛-日照赛场-算法赛-数字城管案件自动分发-初赛

Primary LanguageJupyter Notebook

2021-shandong-rizhao-baseline

  1. EDA

    • 异常数据的发现与清洗
    • 训练集与测试集的分布对比
  2. 建模思路:

  • 按表格/推荐/时序题的方法做特征,但一定要小心泄漏。

  • NLP:Bert/w2v/tf-idf。这里提供了bert的baseline,训练耗时会比较长。