Don't specify node-format option when using UniDic
massongit opened this issue · 1 comments
massongit commented
If we want to specify node-format
option when using UniDic, the content of this option won't be reflected in the analysis results unless we specify -O ""
as an argument.
Example:
$ echo "このタスクにキミをアサインしておいたから。" | mecab -d /var/lib/mecab/dic/unidic -F%m\t%t,%f[12]\n # When -O "" isn't specified
この コノ コノ 此の 連体詞
タスク タスク タスク タスク-task 名詞-普通名詞-一般
に ニ ニ に 助詞-格助詞
キミ キミ キミ 君-代名詞 代名詞
を オ ヲ を 助詞-格助詞
アサイン アサイン アサイン アサイン-assign 名詞-普通名詞-サ変可能
し シ スル 為る 動詞-非自立可能 サ行変格 連用形-一般
て テ テ て 助詞-接続助詞
おい オイ オク 置く 動詞-非自立可能 五段-カ行 連用形-イ音便
た タ タ た 助動詞 助動詞-タ 終止形-一般
から カラ カラ から 助詞-接続助詞
。 。 補助記号-句点
EOS
$ echo "このタスクにキミをアサインしておいたから。" | mecab -d /var/lib/mecab/dic/unidic -O "" -F%m\t%t,%f[12]\n # When -O "" is specified
この 6,和
タスク 7,外
に 6,和
キミ 7,和
を 6,和
アサイン 7,外
し 6,和
て 6,和
おい 6,和
た 6,和
から 6,和
。 3,記号
EOS