arules包中interestMeasure函数中的measures范围,R与包manul中的描述不一样
The ranges of the measures in interestMeasure function in arules package, R are not same as the description in the package manul
我正在使用 artules 包,R 来查找积极相关的产品。我使用函数 interestMeasure 提供的一些度量来评估规则。但是,我发现 kappa 和 leastContradiction 措施的范围与包手册不同。这是一个例子,代码在包手册中对interestMeasure的解释中:
data("Income")
rules <- apriori(Income)
quality(rules)$kappa <- interestMeasure(rules,measure='kappa',transactions = Income)
quality(rules)$leastContradiction <- interestMeasure(rules,measure='leastContradiction',transactions = Income)
try <- as(rules,'data.frame')
为了方便起见,我做了一点改动。在示例中,leastContradiction 和 kappa 的范围是:
> summary(try$leastContradiction)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.08794 0.13920 0.17000 0.18930 0.22170 0.90460
> summary(try$kappa)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-43160000 -20510000 -19140000 -17660000 -12220000 -8042000
我在自己的数据上尝试了这两个措施,总结为:
> summary(myData1$kappa)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-5767000000000 -5765000000000 -5756000000000 -5745000000000 -5728000000000 -5610000000000
> summary(myData1$leastContradiction)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-218.9000 -5.4530 -2.0120 -4.9540 -1.1050 0.8824
然而,在包手册中,这两个措施是这样解释的:
可以看出范围非常不同。那么,我是否应该自己将此类措施的范围缩小到[-1,1]?
这确实是一个错误。解决方案:在 kappa 计算中添加了缺少的括号,并为最小矛盾添加了固定方程。该修复程序现已在 github 的开发版本中可用,并将成为下一个版本(规则 1.2-3)的一部分。
我正在使用 artules 包,R 来查找积极相关的产品。我使用函数 interestMeasure 提供的一些度量来评估规则。但是,我发现 kappa 和 leastContradiction 措施的范围与包手册不同。这是一个例子,代码在包手册中对interestMeasure的解释中:
data("Income")
rules <- apriori(Income)
quality(rules)$kappa <- interestMeasure(rules,measure='kappa',transactions = Income)
quality(rules)$leastContradiction <- interestMeasure(rules,measure='leastContradiction',transactions = Income)
try <- as(rules,'data.frame')
为了方便起见,我做了一点改动。在示例中,leastContradiction 和 kappa 的范围是:
> summary(try$leastContradiction)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.08794 0.13920 0.17000 0.18930 0.22170 0.90460
> summary(try$kappa)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-43160000 -20510000 -19140000 -17660000 -12220000 -8042000
我在自己的数据上尝试了这两个措施,总结为:
> summary(myData1$kappa)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-5767000000000 -5765000000000 -5756000000000 -5745000000000 -5728000000000 -5610000000000
> summary(myData1$leastContradiction)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-218.9000 -5.4530 -2.0120 -4.9540 -1.1050 0.8824
然而,在包手册中,这两个措施是这样解释的:
可以看出范围非常不同。那么,我是否应该自己将此类措施的范围缩小到[-1,1]?
这确实是一个错误。解决方案:在 kappa 计算中添加了缺少的括号,并为最小矛盾添加了固定方程。该修复程序现已在 github 的开发版本中可用,并将成为下一个版本(规则 1.2-3)的一部分。