ELKI的输出指标
Output index of ELKI
我正在使用 ELKI 对来自 CSV 文件的数据进行聚类
我用
-resulthandler ResultWriter
-out folder/
保存输出数据
但是作为输出我有一些奇怪的索引
ID=2138 0.1799 0.2761
ID=2137 0.1797 0.2778
ID=2136 0.1796 0.2787
ID=2109 0.1161 0.2072
ID=2007 0.1139 0.2047
尽管我只有不到100个训练样本,但ID却超过了2000
DBID 是内部的;文档清楚地表明你不应该对它们做出太多假设,因为它们的实现可能改变。它们被写入输出的唯一原因是因为某些方法(例如 OPTICS)可能需要通过此唯一 ID 交叉引用对象。
因为它们是 唯一的 标识符,所以它们通常会不断递增。下次再在MiniGUI中点击"run",就会得到接下来的n个ID……这么明显,你不止一次点击了运行。
ELKI DBID 文档中的 "Tips & Tricks" 可能会回答您的基本问题 - 如何将映射 DBID 用于输入文件的行号。最好的方法是如果你想拥有对象标识符,通过使用标识符列(并将其配置为外部标识符)自己分配对象标识符。
有关详细信息,请参阅文档:https://elki-project.github.io/dev/dbids
我正在使用 ELKI 对来自 CSV 文件的数据进行聚类
我用
-resulthandler ResultWriter
-out folder/
保存输出数据
但是作为输出我有一些奇怪的索引
ID=2138 0.1799 0.2761
ID=2137 0.1797 0.2778
ID=2136 0.1796 0.2787
ID=2109 0.1161 0.2072
ID=2007 0.1139 0.2047
尽管我只有不到100个训练样本,但ID却超过了2000
DBID 是内部的;文档清楚地表明你不应该对它们做出太多假设,因为它们的实现可能改变。它们被写入输出的唯一原因是因为某些方法(例如 OPTICS)可能需要通过此唯一 ID 交叉引用对象。
因为它们是 唯一的 标识符,所以它们通常会不断递增。下次再在MiniGUI中点击"run",就会得到接下来的n个ID……这么明显,你不止一次点击了运行。
ELKI DBID 文档中的 "Tips & Tricks" 可能会回答您的基本问题 - 如何将映射 DBID 用于输入文件的行号。最好的方法是如果你想拥有对象标识符,通过使用标识符列(并将其配置为外部标识符)自己分配对象标识符。
有关详细信息,请参阅文档:https://elki-project.github.io/dev/dbids