Text preprocessing dengan menggunakan bahasa indonesia
Data yang digunakan dalam proses preprocessing adalah data tweets. (Tidak dapat diunggah dalam project ini dikarenakan policy dari Twitter.)
Data kamus.txt merupakan data list stop words yang telah dibuat dan telah didiskusikan dengan dosen Bahasa Indonesia di salah satu Universitas Negeri di Indonesia
Data slang.csv merupakan data list kata normalisasi yang telah dibuat dan telah didiskusikan dengan dosen Bahasa Indonesia di salah satu Universitas Negeri di Indonesia
Harap mencantumkan referensi link jika dirasa bermanfaat untuk kepentingan penelitian maupun project pribadi Anda.
adeariniputri/text-preprocesing
Text preprocessing dengan menggunakan bahasa indonesia
Jupyter Notebook