单列之间的R Apriori函数相关性
R Apriori function correlation between a single column
我正在尝试从我拥有的 CSV 文件中查找关联规则,该文件包含以下几列:
Desc 是对购买内容的描述,UUID 是个人每笔交易的唯一 ID。也就是说一个UUID可以有多个Desc
我试图找到的关联规则类型是,例如,如果我看到许多不同的 UUID 有两个 Desc,称它们为肉和啤酒。一条规则会显示:{Meat} => {Beer} 带有支持、信心和提升。
可以在此处找到 csv:https://github.com/antonio1695/RStudio/blob/master/facturas_du.csv
我想做的是:
libary(arules)
df <- read.csv("facturas_du.csv")
rules <- apriori(df_du,parameter=list(support=0.01,confidence=0.3))
尽管如此,它给我的关联规则对类型的支持很少:
{An UUID} => {A Desc}
这不是我要找的。
我希望我的 UUID 成为我的交易 ID,并且有类似的内容:
UUID DESC
123 Meat,Beer
我希望有人能帮我找到该做什么。谢谢!
UUID 不应该是一个项目。您应该首先手动将您的数据转换为交易,以查看您的数据被使用的内容和方式。这是您目前正在做的事情:
library(arules)
df <- read.csv("https://raw.githubusercontent.com/antonio1695/RStudio/master/facturas_du.csv")
head(df)
Desc UUID
1 CONSUMO 38BD37F1-06E9-476B-8779-E6E8139B2586
2 CONSUMO DE ALIMENTOS 2BE26034-ED04-407A-ACE7-51764EEBE8CF
3 CONSUMO DE ALIMENTOS 9b24977d-8e67-4b0f-a55f-c0e886561b9d
4 PAGO POR USO DE ESTACIONAMIENTO 6FAEBEF1-2CCB-4DAB-BD2F-E765EC093F56
5 COPIA CARTA B&N 1-99 HOJAS 4D3F3204-3699-42DE-A97B-8D0F990B54A5
6 IMPRESION CARTA B&N 1-99 HOJAS 4D3F3204-3699-42DE-A97B-8D0F990B54A5
trans <- as(df, "transactions")
inspect(head(trans))
items transactionID
1 {Desc=CONSUMO,
UUID=38BD37F1-06E9-476B-8779-E6E8139B2586} 1
2 {Desc=CONSUMO DE ALIMENTOS,
UUID=2BE26034-ED04-407A-ACE7-51764EEBE8CF} 2
3 {Desc=CONSUMO DE ALIMENTOS,
UUID=9b24977d-8e67-4b0f-a55f-c0e886561b9d} 3
4 {Desc=PAGO POR USO DE ESTACIONAMIENTO,
UUID=6FAEBEF1-2CCB-4DAB-BD2F-E765EC093F56} 4
5 {Desc=COPIA CARTA B&N 1-99 HOJAS,
UUID=4D3F3204-3699-42DE-A97B-8D0F990B54A5} 5
6 {Desc=IMPRESION CARTA B&N 1-99 HOJAS,
UUID=4D3F3204-3699-42DE-A97B-8D0F990B54A5} 6
我认为这不是您想要的。每个交易应该是一组项目,而不是一个产品和一个 UUID 的组合。我强烈建议您阅读 arules package vignette。
我正在尝试从我拥有的 CSV 文件中查找关联规则,该文件包含以下几列: Desc 是对购买内容的描述,UUID 是个人每笔交易的唯一 ID。也就是说一个UUID可以有多个Desc
我试图找到的关联规则类型是,例如,如果我看到许多不同的 UUID 有两个 Desc,称它们为肉和啤酒。一条规则会显示:{Meat} => {Beer} 带有支持、信心和提升。
可以在此处找到 csv:https://github.com/antonio1695/RStudio/blob/master/facturas_du.csv
我想做的是:
libary(arules)
df <- read.csv("facturas_du.csv")
rules <- apriori(df_du,parameter=list(support=0.01,confidence=0.3))
尽管如此,它给我的关联规则对类型的支持很少:
{An UUID} => {A Desc}
这不是我要找的。
我希望我的 UUID 成为我的交易 ID,并且有类似的内容:
UUID DESC
123 Meat,Beer
我希望有人能帮我找到该做什么。谢谢!
UUID 不应该是一个项目。您应该首先手动将您的数据转换为交易,以查看您的数据被使用的内容和方式。这是您目前正在做的事情:
library(arules)
df <- read.csv("https://raw.githubusercontent.com/antonio1695/RStudio/master/facturas_du.csv")
head(df)
Desc UUID
1 CONSUMO 38BD37F1-06E9-476B-8779-E6E8139B2586
2 CONSUMO DE ALIMENTOS 2BE26034-ED04-407A-ACE7-51764EEBE8CF
3 CONSUMO DE ALIMENTOS 9b24977d-8e67-4b0f-a55f-c0e886561b9d
4 PAGO POR USO DE ESTACIONAMIENTO 6FAEBEF1-2CCB-4DAB-BD2F-E765EC093F56
5 COPIA CARTA B&N 1-99 HOJAS 4D3F3204-3699-42DE-A97B-8D0F990B54A5
6 IMPRESION CARTA B&N 1-99 HOJAS 4D3F3204-3699-42DE-A97B-8D0F990B54A5
trans <- as(df, "transactions")
inspect(head(trans))
items transactionID
1 {Desc=CONSUMO,
UUID=38BD37F1-06E9-476B-8779-E6E8139B2586} 1
2 {Desc=CONSUMO DE ALIMENTOS,
UUID=2BE26034-ED04-407A-ACE7-51764EEBE8CF} 2
3 {Desc=CONSUMO DE ALIMENTOS,
UUID=9b24977d-8e67-4b0f-a55f-c0e886561b9d} 3
4 {Desc=PAGO POR USO DE ESTACIONAMIENTO,
UUID=6FAEBEF1-2CCB-4DAB-BD2F-E765EC093F56} 4
5 {Desc=COPIA CARTA B&N 1-99 HOJAS,
UUID=4D3F3204-3699-42DE-A97B-8D0F990B54A5} 5
6 {Desc=IMPRESION CARTA B&N 1-99 HOJAS,
UUID=4D3F3204-3699-42DE-A97B-8D0F990B54A5} 6
我认为这不是您想要的。每个交易应该是一组项目,而不是一个产品和一个 UUID 的组合。我强烈建议您阅读 arules package vignette。