如何解释 Mlxtend 关联规则的结果

How to interpret results of Mlxtend's association rule

我正在使用mlxtend查找关联规则:

代码如下:

df = apriori(dum_data, min_support=0.4, use_colnames=True)
rules = association_rules(df, metric="lift", min_threshold=1)
rules2=rules[ (rules['lift'] >= 1) & (rules['confidence'] >= 0.7) ]

输出:

antecedents             consequents    antecedentsupport    consequentsupport   support confidence  lift      leverage  conviction
frozenset({'C'})        frozenset({'B'})        0.63        0.705                   0.45    0.726   1.030       0.013   1.077
frozenset({'A'})        frozenset({'B'})        0.98        0.705                   0.69    0.70    1.003       0.0007  1.00081
frozenset({'A', 'C'})   frozenset({'B'})        0.63        0.705                   0.45    0.72    1.030       0.013   1.0776

我给了一个min support=0.4antecedentsupportconsequentsupportsupport有什么区别?

lift and leverage?什么意思lift and leverage?如何判断好坏?

置信度我可以理解为输出中的第一条规则 CB 一起出现了多少次。 ?对吗

以第三条规则({A,C} => {B})为例:

支持 = {A, B, C} 的支持 |支持意味着,您计算包含所有三个 {A, B, C} 的交易数量,并将其除以交易总数。

antecedentsupport = 支持 => 之前的内容,表示支持 {A,C}

consequentsupport = 支持 => 之后的内容,表示支持 {B}

置信度 = 在我们观察到 {A,C} 之后交易还包含 {B} 的可能性有多大。将其视为条件概率 p(B 给定 {A,C})。

电梯:电梯的定义可以是例如发现于此:wikipedia。这意味着,如果 lift < 1,则 {A,C} 和 {B} 一起出现的频率低于预期。如果提升度大于 1,则 {A,C} 和 {B} 一起出现的频率高于预期。

杠杆大致相同。它还比较预期的同现和观察到的同现。进一步的解释,例如here

什么是好的 lift/leverage 是主观的,但我建议提升 > 1。如果涉及到规则,我会更多地关注信心。