MALLET - 如何将包含字数的 csv 文件传递​​给 mallet 中的朴素贝叶斯?

MALLET - How to pass the csv file which contains word count to näive bayes in mallet?

我创建了包含标签名称和词频的 CSV 文件。

例如

    0, 4.0, 0.0, 0.0, 1.0, 0.0

    0, 0.0, 1.0, 2.0, 0.0, 0.0

    1, 1.0, 0.0, 0.0, 0.0, 3.0

其中索引零表示标签(0 和 1)

我的问题是,如何将这种CSV文件导入mallet以生成实例列表?如何将此文件传递给朴素贝叶斯分类器?

我找到了我自己问题的答案。

在 mallet 中,有一些管道可以创建 CSV 到特征向量。

    pipeList.add(new Csv2Array());
    pipeList.add(new Target2Label());
    pipeList.add(new Array2FeatureVector());

以上示例的输出: 0和1:作为目标名称。

第一行: 1(1)=4.0

2(2)=0.0

3(3)=0.0

4(4)=1.0 5(5)=0.0

其他两行同理