ミャンマー語の位置を表す補語であるတွင် /twìɴ (dwìɴ)/ と ၌ /hnaiʔ/の使い分けについての分析

要旨

本稿はニュースコーパスの分析から、ビルマ語の位置の補語であるတွင် /twìɴ (dwìɴ)/ が၌ /hnaiʔ/ よりも空間上の広い範囲を表していることを指摘した。ニュースコーパスの概要およびデータ構造を示し、前処理を施しတွင် /twìɴ (dwìɴ)/ ၊ ၌ /hnaiʔ/ の直前に共起する名詞、直後に共起する動詞をそれぞれ分析した。

データ

本プロジェクトで作成したデータは全てoutputディレクトリ以下に保存している。

分析結果

位置を表す補語と直前の名詞、位置を表す補語と直後の動詞それぞれの頻度は以下のグラフのようになった。

၌ /hnaiʔ/, တွင် /twìɴ (dwìɴ)/, မှာ /hmà/ の各名詞のコーパス総数に対する割合

alt text

၌ /hnaiʔ/, တွင် /twìɴ (dwìɴ)/, မှာ /hmà/ の各動詞のコーパス総数に対する割合

alt text

上位15番目までに共起する頻度の多かった名詞と動詞にカイ2乗分析をした。

၌ /hnaiʔ/, တွင် /twìɴ (dwìɴ)/と各名詞のカイ2乗値のグラフ

alt text

၌ /hnaiʔ/, တွင် /twìɴ (dwìɴ)/と各動詞のカイ2乗値のグラフ

alt text

謝辞

Rの前処理とデータフレームの作成 @ryota.m ニューラルネットワークによる助詞分類器の作成 @kent0304 それぞれ大変お世話になりました。ここに謝意を表します。