如何解释 Mlxtend 关联规则的结果
How to interpret results of Mlxtend's association rule
我正在使用mlxtend
查找关联规则:
代码如下:
df = apriori(dum_data, min_support=0.4, use_colnames=True)
rules = association_rules(df, metric="lift", min_threshold=1)
rules2=rules[ (rules['lift'] >= 1) & (rules['confidence'] >= 0.7) ]
输出:
antecedents consequents antecedentsupport consequentsupport support confidence lift leverage conviction
frozenset({'C'}) frozenset({'B'}) 0.63 0.705 0.45 0.726 1.030 0.013 1.077
frozenset({'A'}) frozenset({'B'}) 0.98 0.705 0.69 0.70 1.003 0.0007 1.00081
frozenset({'A', 'C'}) frozenset({'B'}) 0.63 0.705 0.45 0.72 1.030 0.013 1.0776
我给了一个min support=0.4
。 antecedentsupport
、consequentsupport
和support
有什么区别?
lift and leverage?
什么意思lift and leverage?
如何判断好坏?
置信度我可以理解为输出中的第一条规则 C
和 B
一起出现了多少次。 ?对吗
以第三条规则({A,C} => {B})为例:
支持 = {A, B, C} 的支持 |支持意味着,您计算包含所有三个 {A, B, C} 的交易数量,并将其除以交易总数。
antecedentsupport = 支持 => 之前的内容,表示支持 {A,C}
consequentsupport = 支持 => 之后的内容,表示支持 {B}
置信度 = 在我们观察到 {A,C} 之后交易还包含 {B} 的可能性有多大。将其视为条件概率 p(B 给定 {A,C})。
电梯:电梯的定义可以是例如发现于此:wikipedia。这意味着,如果 lift < 1,则 {A,C} 和 {B} 一起出现的频率低于预期。如果提升度大于 1,则 {A,C} 和 {B} 一起出现的频率高于预期。
杠杆大致相同。它还比较预期的同现和观察到的同现。进一步的解释,例如here
什么是好的 lift/leverage 是主观的,但我建议提升 > 1。如果涉及到规则,我会更多地关注信心。
我正在使用mlxtend
查找关联规则:
代码如下:
df = apriori(dum_data, min_support=0.4, use_colnames=True)
rules = association_rules(df, metric="lift", min_threshold=1)
rules2=rules[ (rules['lift'] >= 1) & (rules['confidence'] >= 0.7) ]
输出:
antecedents consequents antecedentsupport consequentsupport support confidence lift leverage conviction
frozenset({'C'}) frozenset({'B'}) 0.63 0.705 0.45 0.726 1.030 0.013 1.077
frozenset({'A'}) frozenset({'B'}) 0.98 0.705 0.69 0.70 1.003 0.0007 1.00081
frozenset({'A', 'C'}) frozenset({'B'}) 0.63 0.705 0.45 0.72 1.030 0.013 1.0776
我给了一个min support=0.4
。 antecedentsupport
、consequentsupport
和support
有什么区别?
lift and leverage?
什么意思lift and leverage?
如何判断好坏?
置信度我可以理解为输出中的第一条规则 C
和 B
一起出现了多少次。 ?对吗
以第三条规则({A,C} => {B})为例:
支持 = {A, B, C} 的支持 |支持意味着,您计算包含所有三个 {A, B, C} 的交易数量,并将其除以交易总数。
antecedentsupport = 支持 => 之前的内容,表示支持 {A,C}
consequentsupport = 支持 => 之后的内容,表示支持 {B}
置信度 = 在我们观察到 {A,C} 之后交易还包含 {B} 的可能性有多大。将其视为条件概率 p(B 给定 {A,C})。
电梯:电梯的定义可以是例如发现于此:wikipedia。这意味着,如果 lift < 1,则 {A,C} 和 {B} 一起出现的频率低于预期。如果提升度大于 1,则 {A,C} 和 {B} 一起出现的频率高于预期。
杠杆大致相同。它还比较预期的同现和观察到的同现。进一步的解释,例如here
什么是好的 lift/leverage 是主观的,但我建议提升 > 1。如果涉及到规则,我会更多地关注信心。