如何将样本权重与分类数据一起用于可视化?
How to use sample weights with categorical data for visualization?
如果有一个如下所示的数据集:
data <- data.frame()
data$gender <- c(F,F,F,M,F)
data$province <- c(G,N,K,L,K)
data$volume <- c(500,750,1250,NA,300)
data$weight <- c(1.36,0.67,5.22,1.66,1.14)
如何将这些权重应用于数据集?仅将样本权重与数值变量相乘就足够了吗?还是分类变量也必须加权?
questionr
和 survey
包处理权重。这是一个例子:
library("questionr")
table <- wtd.table(data$gender, weights = data$weight)
barplot(as.matrix(table))
如果有一个如下所示的数据集:
data <- data.frame()
data$gender <- c(F,F,F,M,F)
data$province <- c(G,N,K,L,K)
data$volume <- c(500,750,1250,NA,300)
data$weight <- c(1.36,0.67,5.22,1.66,1.14)
如何将这些权重应用于数据集?仅将样本权重与数值变量相乘就足够了吗?还是分类变量也必须加权?
questionr
和 survey
包处理权重。这是一个例子:
library("questionr")
table <- wtd.table(data$gender, weights = data$weight)
barplot(as.matrix(table))