Dataset yang digunakan sebanyak 1000 tweet yang berbahasa Indonesia. Setiap tweet hanya mewakili satu emosi saja, ada enam jenis emosi yang digunakan yaitu anger, fear, joy, dan sadness.
- Remove punctuation.
- Case folding.
- Slang handling.
- Negation convert.
- Stopword removal.
- Tokenization.
- Stemming.
- bag of words.
- Multinomial Naïve Bayes.