/paser

形態素解析

Primary LanguagePythonMIT LicenseMIT

Janomeを使用した形態素解析

Python実行環境

Anacondaがあれば問題なし。もちろん標準パックでもOK。

エディタ

お気に入りのIDEで。PycharmとかAtomあたりがやっぱりポピュラーだろうか。個人的にはVSCodeが軽くて好き。

形態素解析

Janome

$ pip install janome

NEologd 辞書を内包した janome

NEologd 辞書を内包した janome をビルドする方法

ビルド済みパッケージから導入

$ pip install Janome-0.3.6.neologd-20180409.tar.gz --no-compile

mecab-ipadic-NEologdは、多数のWeb上の言語資源から得た新語を追加することでカスタマイズしたMeCab 用のシステム辞書。速度は遅いが、より正確に分解してくれる。

Word読込

python-docx

$ pip install python-docx

docx形式のみ読込可能(docは不可)。一番モダンなため採用。