/thai-cut-slim

word tokenization for thai language

Primary LanguageJavaScriptGNU General Public License v3.0GPL-3.0

thai-cut-slim

word tokenization for thai language

Installation

Use the package manager nodejs to install thai-cut-slim.

npm i -s thai-cut-slim

Usage

const thaiCut = require('thai-cut-slim')

thaiCut.cut('ทดสอบระบบตัดคำ') # returns ['ทดสอบ','ระบบ','ตัด','คำ']

Usage addon

const thaiCut = require('thai-cut-slim')

thaiCut.addon(['โห', 'อิอิ'])

thaiCut.cut('ทดสอบเพิ่มคำที่ไม่มีในดิกชันนารี่ เช่น โห อิอิ') # returns [ 'ทดสอบ', 'เพิ่ม', 'คำ', 'ที่', 'ไม่มี', 'ใน', 'ดิกชันนารี', 'เช่น', 'โห', 'อิอิ' ]

Contributing

Pull requests are welcome. For major changes, please open an issue first to discuss what you would like to change.

Please make sure to update tests as appropriate.

License

GNU General Public License v3.0