如何解释 mecab unidic csv 列

how to interpret mecab unidic csv columns

以下是 mecab unidic 的一些示例条目:

ネコ - 名詞,普通名詞,一般,,,,ネコ,猫,ネコ,ネコ,ネコ,ネコ,和,,,,,,,体,ネコ,ネコ,ネコ,ネコ,1,C4,,7918141644612096,28806

が - 助詞,格助詞,,,,,ガ,が,が,ガ,が,ガ,和,,,,,,,格助,ガ,ガ,ガ,ガ,,動詞%F2@0,名詞%F1,,2168520431510016,7889

蚊 - 名詞,普通名詞,一般,,,,カ,蚊,蚊,カ,蚊,カ,和,,,,,,,体,カ,カ,カ,カ,0,C4,,1536851034907136,5591

を - 助詞,格助詞,,,,,ヲ,を,を,オ,を,オ,和,,,,,,,格助,ヲ,ヲ,ヲ,ヲ,,動詞%F2@0,名詞%F1,形容詞%F2@-1,,11381878116459008,41407

如您所见,这些 un​​idic 条目中有 30 个 csv 列。它们都代表什么?

您可以在 UniDic FAQ 看到所有栏目的日文名称列表。看到名称后,大多数列都非常明显。

UniDic Manual 中有更多详细信息解释了所有字段,但对于其中一些字段(主要是 *ConType*ModType 字段)来说,它们相当复杂。这些字段大多与复合词的发音有关。