taku910/mecab

Java/OSX: MeCab::Tagger::parseToNote() as the very first step returns broken pointer of Node::surface()

tianjianjiang opened this issue · 0 comments

  • What steps will reproduce the problem?

    • brew install mecab
    • brew install mecab-ipadic
    • build the java-binding of 0.996
    • modify mecab/mecab/java/test.java to skip System.out.println(tagger.parse(str)); such that the next line Node node = tagger.parseToNode(str); will be the very first step right after MeCab::Tagger is initialized.
  • What is the expected output?

    太郎 名詞,固有名詞,人名,名,,,太郎,タロウ,タロー
    は 助詞,係助詞,,,,,は,ハ,ワ
    二郎 名詞,固有名詞,人名,名,,,二郎,ジロウ,ジロー
    に 助詞,格助詞,一般,,,,に,ニ,ニ
    この 連体詞,
    ,,,,,この,コノ,コノ
    本 名詞,一般,,,,,本,ホン,ホン
    を 助詞,格助詞,一般,,,,を,ヲ,ヲ
    渡し 動詞,自立,
    ,,五段・サ行,連用形,渡す,ワタシ,ワタシ
    た 助動詞,
    ,,,特殊・タ,基本形,た,タ,タ
    。 記号,句点,,,,,。,。,。

  • What do you see instead?

    名詞,固有名詞,人名,名,,,太郎,タロウ,タロー
    ]z( 助詞,係助詞,,,,,は,ハ,ワ
    )Lorg/ 名詞,固有名詞,人名,名,,,二郎,ジロウ,ジロー
    cha 助詞,格助詞,一般,,,,に,ニ,ニ
    sen/me 連体詞,
    ,,,,,この,コノ,コノ
    cab 名詞,一般,,,,,本,ホン,ホン
    /Pa 助詞,格助詞,一般,,,,を,ヲ,ヲ
    th;し 動詞,自立,
    ,,五段・サ行,連用形,渡す,ワタシ,ワタシ
    た 助動詞,
    ,,,特殊・タ,基本形,た,タ,タ
    。 記号,句点,,,,,。,。,。

  • What version of the product are you using?

    • mecab-0.996.tar.gz
    • mecab-java-0.996.tar.gz
  • On what operating system?
    Mac OS X El Capitan 10.11.4