iPhoneからMeCabを呼びたい(3)
MeCabのmecab_node_tのパラメータについて調べる。
- surface
- 形態素の文字列情報。わかちした結果。
- feature
- CSVで表記された素性情報。iPhoneのMeCab(or MeCab辞書?)は漢字変換用のようで、ひらながの場合は、漢字の候補取得できる。
- posid
- 出力される素性(品詞)のID。任意に設定できる。iPhoneでは、設定ファイルは見当たらなかったけど、かなり詳しく割り振られている模様。
- char_type
- 文字種情報。漢字、ひらがな、カタカナ、記号、などの分類(だと思う)。
- stat
- 形態素の種類: MECAB_NOR_NODE(normal) 0、MECAB_UNK_NODE(unknown) 1、MECAB_BOS_NODE(beginning of sentence) 2、MECAB_EOS_NODE(end of sentence) 3。
- cost
- 累積コスト。その形態素までのコスト。その単語がそこで出てくる確率的なもので、コストが低い=出現しやすい。
僕がお世話になるのは、surfaceとposidかなぁ。
posidはもうちょっと大雑把に分けてくれたほうが良かったかなぁ…。