/Perbaikan-Kata-Bahasa-Indonesia

Program yang dapat memperbaiki kata tidak formal dalam Bahasa Indonesia menjadi kata formal dengan menggunakan Word2Vec dan Edit Distance

Primary LanguageJupyter Notebook

Perbaikan Kata Bahasa Indonesia

Program yang dapat memperbaiki kata tidak formal dalam Bahasa Indonesia menjadi kata formal dengan menggunakan Word2Vec dan Edit Distance

Program ini dibuat untuk memenuhi tugas akhir dari matakuliah Pembelajaran Mesin Program ini disusun oleh Kelompok 14:

  1. Cahaya Pakpahan
  2. Achmad Nasution
  3. Andre Sitorus

Program ini terinspirasi dari:

  1. Membuat Model Word2Vec Bahasa Indonesia dari Wikipedia Menggunakan Gensim, by Dieka Nugraha K https://medium.com/@diekanugraha/membuat-model-word2vec-bahasa-indonesia-dari-wikipedia-menggunakan-gensim-e5745b98714d

  2. Build a spell-checker with word2vec data (with python), by Thomas Decaux https://medium.com/@thomasdecaux/build-a-spell-checker-with-word2vec-data-with-python-5438a9343afd

Untuk Corpus yang digunakan dapat diunduh pada link berikut:

  1. https://dumps.wikimedia.org/idwiki/latest/ , Wiki Corpus in Indoensia
  2. https://raw.githubusercontent.com/nasalsabila/kamus-alay/master/colloquial-indonesian-lexicon.csv , Slang Word in Indonesia