/bilp

Bahasa Indonesia Language Processing

Primary LanguagePython

bilp

Bahasa Indonesia Language Processing

Dibuat untuk membantu pemrosesan Twitter yang menggunakan bahasa Indonesia. Disertakan data berupa crawling hasil penelitian analisis sentimen saat Pemilu 2014. Dalam repository ini juga disediakan kamus singkatan (abbreviation) yang biasa digunakan oleh tweeps berbahasa Indonesia. Untuk kamus slang yang lebih lengkap, silakan cek repositori ini yang dikerjakan oleh mahasiswa saya.

Repositori ini juga mencantumkan stoplist yang didasarkan dari [1].

Author:

Referensi:

  1. Tala, F. Z. (2003). A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia. M.S. thesis. M.Sc. Thesis. Master of Logic Project. Institute for Logic, Language and Computation. Universiteti van Amsterdam The Netherlands.