csv 二进制可执行文件的 ARFF 文件扩展名

ARFF file extension to csv binary executable

在此先感谢您的帮助。

我正在寻找二进制可执行文件以在 bash 脚本中将 .arff 转换为 .csv。理想情况下,我可以 运行 按照

#! /bin/sh
... some stuff....
converstionFunc input.arff output.csv
... some more stuff ...

在考虑自己编写此代码时,我发现 weka 提供了一个我可以利用的库,它允许我执行此操作。然而,尽管我寻找它,但我找不到它。我在我的 mac 上安装了 weka,在四处寻找库后我仍然找不到它。

有谁知道我在哪里可以找到这样的可执行文件,或者能告诉我在哪里可以获得 weka java 库,让我自己编写它?

尝试通过网络搜索 arff2csv。看起来有很多实用程序。

克隆此 github 存储库。它在 "tools" 子目录中包含一个 arff2csv 工具。

arff2csv 旨在 运行 在 unix 命令行工具的管道中。

https://github.com/jeroenjanssens/data-science-at-the-command-line

arff2csv 是一个单行 shell 脚本,它调用另一个 shell 脚本,该脚本调用 weka.jar、

所以它需要 java 安装在您的机器上;并注意 arff2csv 需要 Weka 3.6 版。 (根据我的实验,较新的 v3.7 不起作用。)

脚本需要设置此环境变量:

export WEKAPATH=/path/to/wekajar-dirname

然后你可以

cat /opt/smallapps/weka-stable/data/breast-cancer.arff | arff2csv > breast-cancer.arff.csv

大型 arff 需要一些时间来处理。

您可以阅读 J.Janssen 的书(请参阅 repo-README)以获取更多信息。