Insane output for a particular input, possibly due to the handling of the case of "ニクラベ"
hkiyomaru opened this issue · 0 comments
hkiyomaru commented
What
When creating an EventGraph from a sentence "web文書での精度に比べ新聞記事での精度は難易度の問題もあり一部低くなっている," the output will be insane.
echo "web文書での精度に比べ新聞記事での精度は難易度の問題もあり一部低くなっている" | jumanpp | knp | evg
{
"sentences": [
{
"sid": "1",
"ssid": 0,
"surf": "web文書での精度に比べ新聞記事での精度は難易度の問題もあり一部低くなっている",
"mrphs": "web 文書 で の 精度 に 比べ 新聞 記事 で の 精度 は 難易 度 の 問題 も あり 一部 低く なって いる",
"reps": "web/web 文書/ぶんしょ で/で の/の 精度/せいど に/に 比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は 難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある 一部/いちぶ 低い/ひくい なる/なる いる/いる"
}
],
"events": [
{
"event_id": 0,
"sid": "1",
"ssid": 0,
"rel": [
{
"event_id": 1,
"label": "並列",
"surf": "",
"reliable": true,
"head_tid": -1
}
],
"surf": "難易度の問題もあり",
"surf_with_mark": "難易度の問題もあり",
"mrphs": "難易 度 の 問題 も あり",
"mrphs_with_mark": "難易 度 の 問題 も あり",
"normalized_mrphs": "難易 度 の 問題 も ある",
"normalized_mrphs_with_mark": "難易 度 の 問題 も ある",
"normalized_mrphs_without_exophora": "難易 度 の 問題 も ある",
"normalized_mrphs_with_mark_without_exophora": "難易 度 の 問題 も ある",
"reps": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
"reps_with_mark": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
"normalized_reps": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
"normalized_reps_with_mark": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
"content_rep_list": [
"難易/なんい",
"度/ど",
"問題/もんだい",
"有る/ある"
],
"pas": {
"predicate": {
"surf": "ある",
"normalized_surf": "ある",
"mrphs": "ある",
"normalized_mrphs": "ある",
"reps": "有る/ある",
"normalized_reps": "有る/ある",
"standard_reps": "有る/ある",
"type": "動",
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"children": []
},
"argument": {
"ガ": [
{
"surf": "問題も",
"normalized_surf": "問題",
"mrphs": "問題 も",
"normalized_mrphs": "問題",
"reps": "問題/もんだい も/も",
"normalized_reps": "問題/もんだい",
"head_reps": "問題/もんだい",
"eid": null,
"flag": "N",
"sdist": 0,
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"children": [
{
"surf": "度の",
"normalized_surf": "度",
"mrphs": "度 の",
"normalized_mrphs": "度",
"reps": "度/ど の/の",
"normalized_reps": "度/ど",
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"modifier": false,
"possessive": true
},
{
"surf": "難易",
"normalized_surf": "難易",
"mrphs": "難易",
"normalized_mrphs": "難易",
"reps": "難易/なんい",
"normalized_reps": "難易/なんい",
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"modifier": false,
"possessive": false
}
]
}
]
}
},
"features": {
"modality": [],
"tense": "unknown",
"negation": false,
"state": "状態述語",
"complement": false
}
},
{
"event_id": 1,
"sid": "1",
"ssid": 0,
"rel": [],
"surf": "比べ新聞記事での精度は一部低くなっている",
"surf_with_mark": "比べ新聞記事での精度は | 一部低くなっている",
"mrphs": "比べ 新聞 記事 で の 精度 は 一部 低く なって いる",
"mrphs_with_mark": "比べ 新聞 記事 で の 精度 は | 一部 低く なって いる",
"normalized_mrphs": "比べ 新聞 記事 で の 精度 は 一部 低く なって いる",
"normalized_mrphs_with_mark": "比べ 新聞 記事 で の 精度 は | 一部 低く なって いる",
"normalized_mrphs_without_exophora": "比べ 新聞 記事 で の 精度 は 一部 低く なって いる",
"normalized_mrphs_with_mark_without_exophora": "比べ 新聞 記事 で の 精度 は | 一部 低く なって いる",
"reps": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は 一部/いちぶ 低い/ひくい なる/なる いる/いる",
"reps_with_mark": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は | 一部/いちぶ 低い/ひくい なる/なる いる/いる",
"normalized_reps": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は 一部/いちぶ 低い/ひくい なる/なる いる/いる",
"normalized_reps_with_mark": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は | 一部/いちぶ 低い/ひくい なる/なる いる/いる",
"content_rep_list": [
"比べる/くらべる",
"新聞/しんぶん",
"記事/きじ",
"精度/せいど",
"一部/いちぶ",
"低い/ひくい"
],
"pas": {
"predicate": {
"surf": "低くなっている",
"normalized_surf": "低くなっている",
"mrphs": "低く なって いる",
"normalized_mrphs": "低く なって いる",
"reps": "低い/ひくい+なる/なる~テ形+いる/いる",
"normalized_reps": "低い/ひくい+なる/なる~テ形+いる/いる",
"standard_reps": "低い/ひくい+なる/なる~テ形+いる/いる",
"type": "動",
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"children": []
},
"argument": {
"ガ2": [
{
"surf": "一部",
"normalized_surf": "一部",
"mrphs": "一部",
"normalized_mrphs": "一部",
"reps": "一部/いちぶ",
"normalized_reps": "一部/いちぶ",
"head_reps": "一部/いちぶ",
"eid": null,
"flag": "N",
"sdist": 0,
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"children": []
}
],
"ガ": [
{
"surf": "精度は",
"normalized_surf": "精度",
"mrphs": "精度 は",
"normalized_mrphs": "精度",
"reps": "精度/せいど は/は",
"normalized_reps": "精度/せいど",
"head_reps": "精度/せいど",
"eid": null,
"flag": "N",
"sdist": 0,
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"children": [
{
"surf": "記事での",
"normalized_surf": "記事",
"mrphs": "記事 で の",
"normalized_mrphs": "記事",
"reps": "記事/きじ で/で の/の",
"normalized_reps": "記事/きじ",
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"modifier": false,
"possessive": false
},
{
"surf": "新聞",
"normalized_surf": "新聞",
"mrphs": "新聞",
"normalized_mrphs": "新聞",
"reps": "新聞/しんぶん",
"normalized_reps": "新聞/しんぶん",
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"modifier": false,
"possessive": false
}
]
}
],
"ニクラベル": [
{
"surf": "精度に比べ",
"normalized_surf": "精度",
"mrphs": "精度 に 比べ",
"normalized_mrphs": "精度",
"reps": "精度/せいど に/に 比べる/くらべる",
"normalized_reps": "精度/せいど",
"head_reps": "精度/せいど",
"eid": null,
"flag": "C",
"sdist": 0,
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"children": [
{
"surf": "文書での",
"normalized_surf": "文書",
"mrphs": "文書 で の",
"normalized_mrphs": "文書",
"reps": "文書/ぶんしょ で/で の/の",
"normalized_reps": "文書/ぶんしょ",
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"modifier": false,
"possessive": false
},
{
"surf": "web",
"normalized_surf": "web",
"mrphs": "web",
"normalized_mrphs": "web",
"reps": "web/web",
"normalized_reps": "web/web",
"adnominal_event_ids": [],
"sentential_complement_event_ids": [],
"modifier": false,
"possessive": false
}
]
}
]
}
},
"features": {
"modality": [],
"tense": "非過去",
"negation": false,
"state": "動態述語",
"complement": false
}
}
]
}