TSUTSUJI-familiarity (version 1.0.0) (2023/11/03)

Description

日本語機能表現辞書『つつじ』 version 1.1に対して、クラウドソーシングにより親密度情報・位相情報を付与したもの

Features

TSUTSUJI.txt

1行目がヘッダ

  • 1列目:WID 調査時のID
  • 2列目:WORD 表層形
  • 3列目:LABEL 『つつじ』のラベル
  • 4列目:FACTOR 印象評定の属性
  • 5列目:VALUE 印象評定値

機能語印象評定情報.xlsx

元データ

1行目がヘッダ

  • 1列目:WID 調査時のID
  • 2列目:WORD 表層形
  • 3列目:LABEL 『つつじ』のラベル
  • 4列目:FACTOR 印象評定の属性
  • 5列目:VALUE 印象評定値

集計結果

1行目がヘッダ

  • 1列目:WORD 表層形
  • 2列目:KNOW 印象評定:「知っている」
  • 3列目:LISTEN 印象評定:「聞く」
  • 4列目:READ 印象評定:「読む」
  • 5列目:SPEAK 印象評定:「話す」
  • 6列目:WRITE 印象評定:「書く」
  • 7列目:5評定合計: KNOW+LISTEN+READ+SPEAK+WRITE
  • 8列目:書記 印象評定: READ+WRITE
  • 10列目:音声 印象評定: LISTEN+SPEAK
  • 11列目:生産 印象評定: SPEAK+WRITE
  • 12列目:受容 印象評定: LISTEN+READ
  • 13列目:書記-音声: READ+WRITE-LISTEN-SPEAK
  • 14列目:生産-受容: SPEAK+WRITE-LISTEN-READ

References

松吉俊、佐藤理史、宇津呂武仁 (2007) 日本語機能表現辞書の編纂, 『自然言語処理』, 14(5), pp.123-146, https://doi.org/10.5715/jnlp.14.5_123

Bocheng Chen, Masayuki Asahara (2023) Word Familiarity Rate Estimation for Japanese Functional Words Using a Bayesian Linear Mixed Model, Proceedings of the Pacific Asia Conference on Language, Information and Computation (PACLIC 37).

Credit

Contact

masayu-a@ninjal.ac.jp