経済学における量的テキスト分析の方法を応用例を示す。鳥取県のハローワークの求人票の分析を題材として、頻度分析、共起分析、辞書分析、機械学習の使い方を説明。本稿は2021年の日本経済学会春季大会で行ったチュートリアルの素材が元になっている。
最新のqnuatedaによる日本語の前処理や、seeded-LDAによる準教師ありトピック分類を主な内容とするので、やや古くなったが『Rによる日本語のテキスト分析入門』と合わせて参照すべし。
- 前処理
- 頻度分析
- 辞書分析
- トピックモデル
経済学における量的テキスト分析の方法を応用例を示す。鳥取県のハローワークの求人票の分析を題材として、頻度分析、共起分析、辞書分析、機械学習の使い方を説明。本稿は2021年の日本経済学会春季大会で行ったチュートリアルの素材が元になっている。
最新のqnuatedaによる日本語の前処理や、seeded-LDAによる準教師ありトピック分類を主な内容とするので、やや古くなったが『Rによる日本語のテキスト分析入門』と合わせて参照すべし。