ku-nlp/pyknp-eventgraph

Insane output for a particular input, possibly due to the handling of the case of "ニクラベ"

hkiyomaru opened this issue · 0 comments

What

When creating an EventGraph from a sentence "web文書での精度に比べ新聞記事での精度は難易度の問題もあり一部低くなっている," the output will be insane.

echo "web文書での精度に比べ新聞記事での精度は難易度の問題もあり一部低くなっている" | jumanpp | knp | evg
{
    "sentences": [
        {
            "sid": "1",
            "ssid": 0,
            "surf": "web文書での精度に比べ新聞記事での精度は難易度の問題もあり一部低くなっている",
            "mrphs": "web 文書 で の 精度 に 比べ 新聞 記事 で の 精度 は 難易 度 の 問題 も あり 一部 低く なって いる",
            "reps": "web/web 文書/ぶんしょ で/で の/の 精度/せいど に/に 比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は 難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある 一部/いちぶ 低い/ひくい なる/なる いる/いる"
        }
    ],
    "events": [
        {
            "event_id": 0,
            "sid": "1",
            "ssid": 0,
            "rel": [
                {
                    "event_id": 1,
                    "label": "並列",
                    "surf": "",
                    "reliable": true,
                    "head_tid": -1
                }
            ],
            "surf": "難易度の問題もあり",
            "surf_with_mark": "難易度の問題もあり",
            "mrphs": "難易 度 の 問題 も あり",
            "mrphs_with_mark": "難易 度 の 問題 も あり",
            "normalized_mrphs": "難易 度 の 問題 も ある",
            "normalized_mrphs_with_mark": "難易 度 の 問題 も ある",
            "normalized_mrphs_without_exophora": "難易 度 の 問題 も ある",
            "normalized_mrphs_with_mark_without_exophora": "難易 度 の 問題 も ある",
            "reps": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
            "reps_with_mark": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
            "normalized_reps": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
            "normalized_reps_with_mark": "難易/なんい 度/ど の/の 問題/もんだい も/も 有る/ある",
            "content_rep_list": [
                "難易/なんい",
                "度/ど",
                "問題/もんだい",
                "有る/ある"
            ],
            "pas": {
                "predicate": {
                    "surf": "ある",
                    "normalized_surf": "ある",
                    "mrphs": "ある",
                    "normalized_mrphs": "ある",
                    "reps": "有る/ある",
                    "normalized_reps": "有る/ある",
                    "standard_reps": "有る/ある",
                    "type": "",
                    "adnominal_event_ids": [],
                    "sentential_complement_event_ids": [],
                    "children": []
                },
                "argument": {
                    "": [
                        {
                            "surf": "問題も",
                            "normalized_surf": "問題",
                            "mrphs": "問題 も",
                            "normalized_mrphs": "問題",
                            "reps": "問題/もんだい も/も",
                            "normalized_reps": "問題/もんだい",
                            "head_reps": "問題/もんだい",
                            "eid": null,
                            "flag": "N",
                            "sdist": 0,
                            "adnominal_event_ids": [],
                            "sentential_complement_event_ids": [],
                            "children": [
                                {
                                    "surf": "度の",
                                    "normalized_surf": "",
                                    "mrphs": "度 の",
                                    "normalized_mrphs": "",
                                    "reps": "度/ど の/の",
                                    "normalized_reps": "度/ど",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": true
                                },
                                {
                                    "surf": "難易",
                                    "normalized_surf": "難易",
                                    "mrphs": "難易",
                                    "normalized_mrphs": "難易",
                                    "reps": "難易/なんい",
                                    "normalized_reps": "難易/なんい",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": false
                                }
                            ]
                        }
                    ]
                }
            },
            "features": {
                "modality": [],
                "tense": "unknown",
                "negation": false,
                "state": "状態述語",
                "complement": false
            }
        },
        {
            "event_id": 1,
            "sid": "1",
            "ssid": 0,
            "rel": [],
            "surf": "比べ新聞記事での精度は一部低くなっている",
            "surf_with_mark": "比べ新聞記事での精度は | 一部低くなっている",
            "mrphs": "比べ 新聞 記事 で の 精度 は 一部 低く なって いる",
            "mrphs_with_mark": "比べ 新聞 記事 で の 精度 は | 一部 低く なって いる",
            "normalized_mrphs": "比べ 新聞 記事 で の 精度 は 一部 低く なって いる",
            "normalized_mrphs_with_mark": "比べ 新聞 記事 で の 精度 は | 一部 低く なって いる",
            "normalized_mrphs_without_exophora": "比べ 新聞 記事 で の 精度 は 一部 低く なって いる",
            "normalized_mrphs_with_mark_without_exophora": "比べ 新聞 記事 で の 精度 は | 一部 低く なって いる",
            "reps": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は 一部/いちぶ 低い/ひくい なる/なる いる/いる",
            "reps_with_mark": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は | 一部/いちぶ 低い/ひくい なる/なる いる/いる",
            "normalized_reps": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は 一部/いちぶ 低い/ひくい なる/なる いる/いる",
            "normalized_reps_with_mark": "比べる/くらべる 新聞/しんぶん 記事/きじ で/で の/の 精度/せいど は/は | 一部/いちぶ 低い/ひくい なる/なる いる/いる",
            "content_rep_list": [
                "比べる/くらべる",
                "新聞/しんぶん",
                "記事/きじ",
                "精度/せいど",
                "一部/いちぶ",
                "低い/ひくい"
            ],
            "pas": {
                "predicate": {
                    "surf": "低くなっている",
                    "normalized_surf": "低くなっている",
                    "mrphs": "低く なって いる",
                    "normalized_mrphs": "低く なって いる",
                    "reps": "低い/ひくい+なる/なる~テ形+いる/いる",
                    "normalized_reps": "低い/ひくい+なる/なる~テ形+いる/いる",
                    "standard_reps": "低い/ひくい+なる/なる~テ形+いる/いる",
                    "type": "",
                    "adnominal_event_ids": [],
                    "sentential_complement_event_ids": [],
                    "children": []
                },
                "argument": {
                    "ガ2": [
                        {
                            "surf": "一部",
                            "normalized_surf": "一部",
                            "mrphs": "一部",
                            "normalized_mrphs": "一部",
                            "reps": "一部/いちぶ",
                            "normalized_reps": "一部/いちぶ",
                            "head_reps": "一部/いちぶ",
                            "eid": null,
                            "flag": "N",
                            "sdist": 0,
                            "adnominal_event_ids": [],
                            "sentential_complement_event_ids": [],
                            "children": []
                        }
                    ],
                    "": [
                        {
                            "surf": "精度は",
                            "normalized_surf": "精度",
                            "mrphs": "精度 は",
                            "normalized_mrphs": "精度",
                            "reps": "精度/せいど は/は",
                            "normalized_reps": "精度/せいど",
                            "head_reps": "精度/せいど",
                            "eid": null,
                            "flag": "N",
                            "sdist": 0,
                            "adnominal_event_ids": [],
                            "sentential_complement_event_ids": [],
                            "children": [
                                {
                                    "surf": "記事での",
                                    "normalized_surf": "記事",
                                    "mrphs": "記事 で の",
                                    "normalized_mrphs": "記事",
                                    "reps": "記事/きじ で/で の/の",
                                    "normalized_reps": "記事/きじ",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": false
                                },
                                {
                                    "surf": "新聞",
                                    "normalized_surf": "新聞",
                                    "mrphs": "新聞",
                                    "normalized_mrphs": "新聞",
                                    "reps": "新聞/しんぶん",
                                    "normalized_reps": "新聞/しんぶん",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": false
                                }
                            ]
                        }
                    ],
                    "ニクラベル": [
                        {
                            "surf": "精度に比べ",
                            "normalized_surf": "精度",
                            "mrphs": "精度 に 比べ",
                            "normalized_mrphs": "精度",
                            "reps": "精度/せいど に/に 比べる/くらべる",
                            "normalized_reps": "精度/せいど",
                            "head_reps": "精度/せいど",
                            "eid": null,
                            "flag": "C",
                            "sdist": 0,
                            "adnominal_event_ids": [],
                            "sentential_complement_event_ids": [],
                            "children": [
                                {
                                    "surf": "文書での",
                                    "normalized_surf": "文書",
                                    "mrphs": "文書 で の",
                                    "normalized_mrphs": "文書",
                                    "reps": "文書/ぶんしょ で/で の/の",
                                    "normalized_reps": "文書/ぶんしょ",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": false
                                },
                                {
                                    "surf": "web",
                                    "normalized_surf": "web",
                                    "mrphs": "web",
                                    "normalized_mrphs": "web",
                                    "reps": "web/web",
                                    "normalized_reps": "web/web",
                                    "adnominal_event_ids": [],
                                    "sentential_complement_event_ids": [],
                                    "modifier": false,
                                    "possessive": false
                                }
                            ]
                        }
                    ]
                }
            },
            "features": {
                "modality": [],
                "tense": "非過去",
                "negation": false,
                "state": "動態述語",
                "complement": false
            }
        }
    ]
}