将文本数据集转换为 .arff 文件

Convert text dataset to .arff file

我有这个数据集https://archive.ics.uci.edu/ml/datasets/Sentiment+Labelled+Sentences

我需要将其从 .txt 文件转换为 .arff 文件以使用 weka 程序进行分类

使用编程语言。

编写这样的程序并不难

  1. 逐行读取输入格式
  2. 输出arff头
  3. 以arff稀疏向量格式输出数据

假设您知道什么是 csv 文件。

 public void Convert(String Path, String Directory, String Filename) throws Exception{
   String InputFilename = Path + Filename+".csv";
    // load CSV
    CSVLoader loader = new CSVLoader();
    loader.setSource(new File(InputFilename));
    Instances data = loader.getDataSet();

    // save ARFF
    ArffSaver saver = new ArffSaver();
    saver.setInstances(data);
    String FileT = Filename;
    saver.setFile(new File(Path+Directory+"\"+FileT));
    saver.writeBatch();