/wrime

OtherNOASSERTION

WRIME: 主観と客観の感情分析データセット [English]

日本語の感情分析の研究のために、以下の特徴を持つデータセットを構築しました。

  • 主観(テキストの筆者1人)と客観(クラウドワーカ3人)の両方の立場から感情ラベルを付与しました。
  • Plutchikの基本8感情(喜び、悲しみ、期待、驚き、怒り、恐れ、嫌悪、信頼)を扱いました。
  • 各感情の強度を4段階(0:無、1:弱、2:中、3:強)でラベル付けしました。
  • Ver.2では、感情極性(-2:強いネガティブ、-1:ネガティブ、0:ニュートラル、1:ポジティブ、2:強いポジティブ)も追加しました。

更新履歴

  • @shunk031 さんが本データセットを HuggingFace Datasets Hub に登録してくださいました。
  • Ver.2: 60人の筆者から収集した35,000件の投稿(Ver.1のサブセット)に感情極性を追加でラベル付けしました。
  • Ver.1: 80人の筆者から収集した43,200件の投稿に感情強度をラベル付けしました。

テキストとラベルの例

投稿:車のタイヤがパンクしてた。。いたずらの可能性が高いんだって。。

喜び 悲しみ 期待 驚き 怒り 恐れ 嫌悪 信頼 感情極性
主観 0 3 0 1 3 0 0 0 0
客観A 0 3 0 3 1 2 1 0 -1
客観B 0 2 0 2 0 0 0 0 -1
客観C 0 2 0 2 0 1 1 0 -2

文献情報

本データセットを研究で利用された場合、論文情報をご連絡いただきましたらここに掲載させていただきます。

謝辞

本研究は、文部科学省によるSociety 5.0 実現化研究拠点支援事業(グラント番号: JPMXP0518071489)の助成を受けたものです。

ライセンス

本データセットは研究目的で利用可能です。再配布はご遠慮ください。

連絡先

  • 梶原 智之(愛媛大学 大学院理工学研究科 助教)
  • 中島 悠太(大阪大学 データビリティフロンティア機構 准教授)

sentiment-dataset at is.ids.osaka-u.ac.jp