ELKI 可以聚类非归一化负点吗?
Can ELKI cluster non-normalized negative points?
我已经解决了这个问题,但解决方案没有帮助。
这是我第一次使用ELKI,所以请多多包涵。我有 45000 个 2D 数据点(在执行 doc2vec 之后)包含负值且未标准化。数据集看起来像这样:
-4.688612 32.793335
-42.990147 -20.499323
-24.948868 -10.822767
-45.502155 -40.917801
27.979715 -40.012688
1.867812 -9.838544
56.284512 6.756072
我正在使用 K-means 算法获得 2 个聚类。但是,我收到以下错误:
Task failed
de.lmu.ifi.dbs.elki.data.type.NoSupportedDataTypeException: No data type found satisfying: NumberVector,field AND NumberVector,variable
Available types: DBID DoubleVector,variable,mindim=0,maxdim=1 LabelList
at de.lmu.ifi.dbs.elki.database.AbstractDatabase.getRelation(AbstractDatabase.java:126)
at de.lmu.ifi.dbs.elki.algorithm.AbstractAlgorithm.run(AbstractAlgorithm.java:81)
at de.lmu.ifi.dbs.elki.workflow.AlgorithmStep.runAlgorithms(AlgorithmStep.java:105)
at de.lmu.ifi.dbs.elki.KDDTask.run(KDDTask.java:112)
at de.lmu.ifi.dbs.elki.application.KDDCLIApplication.run(KDDCLIApplication.java:61)
at [...]
所以我的问题是,ELKI 是否要求数据在 [0,1] 范围内,因为我遇到的所有示例的数据都在该范围内。
还是ELKI不接受负值?
如果还有其他问题,有人可以指导我完成这个吗?
谢谢!
ELKI 可以 很好地处理负值。
您的输入数据格式不正确。与
中的问题相同
显然你的线条有 0 或 1 个值。 ELKI 本身对此很好,但是
k-means 要求数据位于 R^d 向量 space 中,因此 ELKI 不能 运行 k-means 在您的数据集上。但原因是输入文件坏了。您可能需要仔细检查您的文件 - 可能至少有一行格式不正确。
我已经解决了这个问题,但解决方案没有帮助。
这是我第一次使用ELKI,所以请多多包涵。我有 45000 个 2D 数据点(在执行 doc2vec 之后)包含负值且未标准化。数据集看起来像这样:
-4.688612 32.793335
-42.990147 -20.499323
-24.948868 -10.822767
-45.502155 -40.917801
27.979715 -40.012688
1.867812 -9.838544
56.284512 6.756072
我正在使用 K-means 算法获得 2 个聚类。但是,我收到以下错误:
Task failed
de.lmu.ifi.dbs.elki.data.type.NoSupportedDataTypeException: No data type found satisfying: NumberVector,field AND NumberVector,variable
Available types: DBID DoubleVector,variable,mindim=0,maxdim=1 LabelList
at de.lmu.ifi.dbs.elki.database.AbstractDatabase.getRelation(AbstractDatabase.java:126)
at de.lmu.ifi.dbs.elki.algorithm.AbstractAlgorithm.run(AbstractAlgorithm.java:81)
at de.lmu.ifi.dbs.elki.workflow.AlgorithmStep.runAlgorithms(AlgorithmStep.java:105)
at de.lmu.ifi.dbs.elki.KDDTask.run(KDDTask.java:112)
at de.lmu.ifi.dbs.elki.application.KDDCLIApplication.run(KDDCLIApplication.java:61)
at [...]
所以我的问题是,ELKI 是否要求数据在 [0,1] 范围内,因为我遇到的所有示例的数据都在该范围内。
还是ELKI不接受负值?
如果还有其他问题,有人可以指导我完成这个吗?
谢谢!
ELKI 可以 很好地处理负值。
您的输入数据格式不正确。与
显然你的线条有 0 或 1 个值。 ELKI 本身对此很好,但是 k-means 要求数据位于 R^d 向量 space 中,因此 ELKI 不能 运行 k-means 在您的数据集上。但原因是输入文件坏了。您可能需要仔细检查您的文件 - 可能至少有一行格式不正确。