kesci-urdu-sentiment-analysis

主要记录kesci的nlp练习赛[Roman Urdu DataSet]的两种解法。机器学习与深度学习lstm的baseline解法

competition link:https://www.kesci.com/home/competition/5c77ab9c1ce0af002b55af86/content/0

some notes:

1.lstm.ipynb:

lstm提交得分在0.83-0.84左右。lstm配套的讲解博客地址：https://blog.csdn.net/ssswill/article/details/88533623

epoch：1~5 is enough

2.SGD.ipynb:

SGD classifier baseline,lb=0.8651。

3.lgb.ipynb:

Lightgbm baseline,lb=0.8447，use bayesian optimization to find hyperparameter for lgbm。

you can improve your score base on this method.

4.一些心得