使用 R 中多个变量的唯一键计算变量值
Count variable values using a unique key of multiple variables in R
我有一个包含变量 STORE、SALES_DT、REGISTER、TRANS_ID 和 PRODUCT 的数据框。
STORE、SALES_DT、REGISTER 和 TRANS_ID 的每个独特组合代表一个独特的交易,而不仅仅是 TRANS_ID。例如,可能存在具有相同商店、日期和交易 ID 以及产品但在不同登记处的交易。任何组合都是可能的。数据框的一小部分可能是...
STORE SALES_DT REGISTER TRANS_ID PRODUCT
1 2017-04-12 3 1234 Milk
1 2017-04-12 3 1234 Milk
1 2014-06-01 14 8901 Eggs
23 2014-06-09 1 4597 Eggs
48 2016-01-25 2 1234 Bread
48 2015-12-09 2 8901 Milk
我如何计算每个会输出类似内容的产品的唯一交易?
PRODUCT
Milk :2
Eggs :2
Bread :1
我试过:
cart <- group_by(dataframe, STORE, SLS_DT, REGISTER, TRANS_ID)
summary(cart$PRODUCT)
但它似乎忽略了计数中的 group_by,因为它输出:
PRODUCT
MILK :3
EGGS :2
BREAD :1
使用n_distinct
查找唯一交易的数量
dataframe %>% group_by(PRODUCT) %>%
summarize(n=n_distinct(TRANS_ID))
我有一个包含变量 STORE、SALES_DT、REGISTER、TRANS_ID 和 PRODUCT 的数据框。
STORE、SALES_DT、REGISTER 和 TRANS_ID 的每个独特组合代表一个独特的交易,而不仅仅是 TRANS_ID。例如,可能存在具有相同商店、日期和交易 ID 以及产品但在不同登记处的交易。任何组合都是可能的。数据框的一小部分可能是...
STORE SALES_DT REGISTER TRANS_ID PRODUCT
1 2017-04-12 3 1234 Milk
1 2017-04-12 3 1234 Milk
1 2014-06-01 14 8901 Eggs
23 2014-06-09 1 4597 Eggs
48 2016-01-25 2 1234 Bread
48 2015-12-09 2 8901 Milk
我如何计算每个会输出类似内容的产品的唯一交易?
PRODUCT
Milk :2
Eggs :2
Bread :1
我试过:
cart <- group_by(dataframe, STORE, SLS_DT, REGISTER, TRANS_ID)
summary(cart$PRODUCT)
但它似乎忽略了计数中的 group_by,因为它输出:
PRODUCT
MILK :3
EGGS :2
BREAD :1
使用n_distinct
查找唯一交易的数量
dataframe %>% group_by(PRODUCT) %>%
summarize(n=n_distinct(TRANS_ID))