PyThaiNLP
Thai natural language processing in Python.
PyThaiNLP is a python module similar to nltk
, but it's working primarily on
Thai language instead of English.
It supports Python 3.4+
Capability
- Thai word segmentation
- Thai wordnet
- Thai Character Clusters (TCC) and ETCC
- Thai stop word
- Thai meta sound
- Thai soundex
- Thai postaggers
- Thai romanization
- Thai misspellings detection and correction
and much more.
Install
using pip.
$ pip install pythainlp
Documentation
Read on https://github.com/PyThaiNLP/pythainlp/tree/dev/docs
License
Apache Software License 2.0
ภาษาไทย
ประมวลภาษาธรรมชาติภาษาไทยในภาษา Python
Natural language processing หรือ การประมวลผลภาษาธรรมชาติ โมดูล PyThaiNLP เป็นโมดูลที่ถูกพัฒนาขึ้นเพื่อพัฒนาการประมวลผลภาษาธรรมชาติภาษาไทยในภาษา Python และมันฟรี (ตลอดไป) เพื่อคนไทยและชาวโลกทุกคน !
เพราะโลกขับเคลื่อนต่อไปด้วยการแบ่งปัน
รองรับ Python 3.4 ขึ้นไป
- หน้าหลัก GitHub : https://github.com/PyThaiNLP/pythainlp/
ความสามารถ
- ตัดคำภาษาไทย
- ถอดเสียงภาษาไทยเป็น Latin
- Postaggers ภาษาไทย
- อ่านตัวเลขเป็นข้อความภาษาไทย
- เรียงจำนวนคำของประโยค
- แก้ไขปัญหาการพิมพ์ลืมเปลี่ยนภาษา
- เช็คคำผิดในภาษาไทย
- รองรับ Thai Character Clusters (TCC) และ ETCC
- Thai WordNet
- Stop Word ภาษาไทย
- Meta Sound ภาษาไทย
- Thai Soundex
- และอื่น ๆ
ติดตั้ง
รองรับ Python 3.4 ขึ้นไป
รุ่นเสถียร
$ pip install pythainlp
รุ่นกำลังพัฒนา
$ pip install https://github.com/PyThaiNLP/pythainlp/archive/dev.zip
เอกสารการใช้งาน
อ่านได้ที่ https://github.com/PyThaiNLP/pythainlp/tree/dev/docs
License
Apache Software License 2.0
พัฒนาโดย PyThaiNLP
Logo
ออกแบบโดยคุณ วรุตม์ พสุธาดล จากการประกวดที่ https://www.facebook.com/groups/408004796247683/permalink/475864542795041/ และ https://www.facebook.com/groups/408004796247683/permalink/474262752955220/
สนับสนุน
คุณสามารถร่วมพัฒนาโครงการนี้ได้ โดยการ Fork และส่ง pull requests กลับมา