本稿はニュースコーパスの分析から、ビルマ語の位置の補語であるတွင် /twìɴ (dwìɴ)/ が၌ /hnaiʔ/ よりも空間上の広い範囲を表していることを指摘した。ニュースコーパスの概要およびデータ構造を示し、前処理を施しတွင် /twìɴ (dwìɴ)/ ၊ ၌ /hnaiʔ/ の直前に共起する名詞、直後に共起する動詞をそれぞれ分析した。
本プロジェクトで作成したデータは全てoutputディレクトリ以下に保存している。
位置を表す補語と直前の名詞、位置を表す補語と直後の動詞それぞれの頻度は以下のグラフのようになった。
上位15番目までに共起する頻度の多かった名詞と動詞にカイ2乗分析をした。
Rの前処理とデータフレームの作成 @ryota.m ニューラルネットワークによる助詞分類器の作成 @kent0304 それぞれ大変お世話になりました。ここに謝意を表します。