单列之间的R Apriori函数相关性

R Apriori function correlation between a single column

我正在尝试从我拥有的 CSV 文件中查找关联规则,该文件包含以下几列: Desc 是对购买内容的描述,UUID 是个人每笔交易的唯一 ID。也就是说一个UUID可以有多个Desc

我试图找到的关联规则类型是,例如,如果我看到许多不同的 UUID 有两个 Desc,称它们为肉和啤酒。一条规则会显示:{Meat} => {Beer} 带有支持、信心和提升。

可以在此处找到 csv:https://github.com/antonio1695/RStudio/blob/master/facturas_du.csv

我想做的是:

libary(arules)
df <- read.csv("facturas_du.csv")
rules <- apriori(df_du,parameter=list(support=0.01,confidence=0.3))

尽管如此,它给我的关联规则对类型的支持很少:

{An UUID} => {A Desc}

这不是我要找的。

我希望我的 UUID 成为我的交易 ID,并且有类似的内容:

UUID     DESC
123      Meat,Beer

我希望有人能帮我找到该做什么。谢谢!

UUID 不应该是一个项目。您应该首先手动将您的数据转换为交易,以查看您的数据被使用的内容和方式。这是您目前正在做的事情:

library(arules)
df <- read.csv("https://raw.githubusercontent.com/antonio1695/RStudio/master/facturas_du.csv")
head(df)
                         Desc                                 UUID
1                         CONSUMO 38BD37F1-06E9-476B-8779-E6E8139B2586
2            CONSUMO DE ALIMENTOS 2BE26034-ED04-407A-ACE7-51764EEBE8CF
3            CONSUMO DE ALIMENTOS 9b24977d-8e67-4b0f-a55f-c0e886561b9d
4 PAGO POR USO DE ESTACIONAMIENTO 6FAEBEF1-2CCB-4DAB-BD2F-E765EC093F56
5      COPIA CARTA B&N 1-99 HOJAS 4D3F3204-3699-42DE-A97B-8D0F990B54A5
6  IMPRESION CARTA B&N 1-99 HOJAS 4D3F3204-3699-42DE-A97B-8D0F990B54A5

trans <- as(df, "transactions")

inspect(head(trans))
   items                                       transactionID
1 {Desc=CONSUMO,                                           
   UUID=38BD37F1-06E9-476B-8779-E6E8139B2586}             1
2 {Desc=CONSUMO DE ALIMENTOS,                              
   UUID=2BE26034-ED04-407A-ACE7-51764EEBE8CF}             2
3 {Desc=CONSUMO DE ALIMENTOS,                              
   UUID=9b24977d-8e67-4b0f-a55f-c0e886561b9d}             3
4 {Desc=PAGO POR USO DE ESTACIONAMIENTO,                   
   UUID=6FAEBEF1-2CCB-4DAB-BD2F-E765EC093F56}             4
5 {Desc=COPIA CARTA B&N 1-99 HOJAS,                        
   UUID=4D3F3204-3699-42DE-A97B-8D0F990B54A5}             5
6 {Desc=IMPRESION CARTA B&N 1-99 HOJAS,                    
   UUID=4D3F3204-3699-42DE-A97B-8D0F990B54A5}             6

我认为这不是您想要的。每个交易应该是一组项目,而不是一个产品和一个 UUID 的组合。我强烈建议您阅读 arules package vignette