如何使用 RapidMiner 计算集群中的 "role" 个实例

How do I count the "role" instances in a cluster using RapidMiner

我有一个 RapidMiner 流程​​,它采用数据集并将其聚类。在输出中我可以看到我的角色,但我想不出一种方法来计算每个集群的角色。如何计算每个集群的角色数。我查看了聚合节点,但我的角色不是可用属性。

本质上,我想弄清楚集群是否说明了这个角色。我也使用 Weka,他们称之为 "Classes to clusters evaluation"。它基本上显示了每个集群的 class(或角色)细分。

我目前的流程:

只有两个属性可用。我的角色不是其中之一。

共有 34 个属性。我想按 ret_zpc 汇总

RapidMiner 有角色的概念。属性可以是 regular、id、cluster 或 label(以及其他一些)之一。甚至还有一个运算符 Set Role 允许更改角色。在 RapidMiner 之外,角色、标签和 class 可以互换使用。

对于您的问题,Aggregate 运算符就是您所需要的。假设您的示例中有一个属性设置为角色 Cluster,另一个属性设置为角色 Label,您 select 这些属性作为分组依据。对于聚合属性,选择另一个属性和 select 计数作为聚合函数。

在你的情况下,你想要的属性没有填充在下拉列表中,但它们仍然可以使用。您只需手动输入它们并将它们显式添加到 selection 标准中。如果 RapidMiner 看不到属性的任何元数据,有时会发生这种属性缺失的情况。如果您更改 Read CSV 运算符以使其具有显式映射,您应该会发现 selection.

的属性出现