Program yang dapat memperbaiki kata tidak formal dalam Bahasa Indonesia menjadi kata formal dengan menggunakan Word2Vec dan Edit Distance
Program ini dibuat untuk memenuhi tugas akhir dari matakuliah Pembelajaran Mesin Program ini disusun oleh Kelompok 14:
- Cahaya Pakpahan
- Achmad Nasution
- Andre Sitorus
Program ini terinspirasi dari:
-
Membuat Model Word2Vec Bahasa Indonesia dari Wikipedia Menggunakan Gensim, by Dieka Nugraha K https://medium.com/@diekanugraha/membuat-model-word2vec-bahasa-indonesia-dari-wikipedia-menggunakan-gensim-e5745b98714d
-
Build a spell-checker with word2vec data (with python), by Thomas Decaux https://medium.com/@thomasdecaux/build-a-spell-checker-with-word2vec-data-with-python-5438a9343afd
Untuk Corpus yang digunakan dapat diunduh pada link berikut:
- https://dumps.wikimedia.org/idwiki/latest/ , Wiki Corpus in Indoensia
- https://raw.githubusercontent.com/nasalsabila/kamus-alay/master/colloquial-indonesian-lexicon.csv , Slang Word in Indonesia