/pythainlp

Thai natural language processing in Python.

Primary LanguagePythonApache License 2.0Apache-2.0

PyThaiNLP Logo

PyThaiNLP

Codacy Badgepypi Build Status Build status Coverage Status

Thai natural language processing in Python.

PyThaiNLP is a python module similar to nltk , but it's working primarily on Thai language instead of English.

It supports Python 3.4+

Capability

  • Thai word segmentation
  • Thai wordnet
  • Thai Character Clusters (TCC) and ETCC
  • Thai stop word
  • Thai meta sound
  • Thai soundex
  • Thai postaggers
  • Thai romanization
  • Thai misspellings detection and correction

and much more.

Install

using pip.

$ pip install pythainlp

Documentation

Read on https://github.com/PyThaiNLP/pythainlp/tree/dev/docs

License

Apache Software License 2.0

ภาษาไทย

ประมวลภาษาธรรมชาติภาษาไทยในภาษา Python

Natural language processing หรือ การประมวลผลภาษาธรรมชาติ โมดูล PyThaiNLP เป็นโมดูลที่ถูกพัฒนาขึ้นเพื่อพัฒนาการประมวลผลภาษาธรรมชาติภาษาไทยในภาษา Python และมันฟรี (ตลอดไป) เพื่อคนไทยและชาวโลกทุกคน !

เพราะโลกขับเคลื่อนต่อไปด้วยการแบ่งปัน

รองรับ Python 3.4 ขึ้นไป

ความสามารถ

  • ตัดคำภาษาไทย
  • ถอดเสียงภาษาไทยเป็น Latin
  • Postaggers ภาษาไทย
  • อ่านตัวเลขเป็นข้อความภาษาไทย
  • เรียงจำนวนคำของประโยค
  • แก้ไขปัญหาการพิมพ์ลืมเปลี่ยนภาษา
  • เช็คคำผิดในภาษาไทย
  • รองรับ Thai Character Clusters (TCC) และ ETCC
  • Thai WordNet
  • Stop Word ภาษาไทย
  • Meta Sound ภาษาไทย
  • Thai Soundex
  • และอื่น ๆ

ติดตั้ง

รองรับ Python 3.4 ขึ้นไป

รุ่นเสถียร

$ pip install pythainlp

รุ่นกำลังพัฒนา

$ pip install https://github.com/PyThaiNLP/pythainlp/archive/dev.zip

เอกสารการใช้งาน

อ่านได้ที่ https://github.com/PyThaiNLP/pythainlp/tree/dev/docs

License

Apache Software License 2.0

พัฒนาโดย PyThaiNLP

Logo

ออกแบบโดยคุณ วรุตม์ พสุธาดล จากการประกวดที่ https://www.facebook.com/groups/408004796247683/permalink/475864542795041/ และ https://www.facebook.com/groups/408004796247683/permalink/474262752955220/

สนับสนุน

คุณสามารถร่วมพัฒนาโครงการนี้ได้ โดยการ Fork และส่ง pull requests กลับมา