试图理解 R 中的 cdplot

Trying to understand cdplot in R

你好,我有一个学术数据集,如果举手的人数增加,他们会得到更高的分数。

分数存储在 Class1 列中,其中 H 表示较高分数,L 表示较低分数。

我通过 R 中的 cdplot 得到了以下情节,但据我了解,如果举手的数量增加,他们的分数就会降低,这是错误的,但我无法正确理解输出。

请帮助我理解输出图的意思。

使用了以下代码-

getwd()
Reading.df <- read.csv("xAPI-Edu-Data.csv")
cdplot(Class1 ~ raisedhands,data =  Reading.df)

低于输出-

相反,暗带代表 class H,随着举起手的数量越来越多,y 轴由暗带主导,表示 class H. 关于这个图的另一种方法,就像你将 x 轴变量分成几类,并随着你增加

询问每个类别中 classes 的比例

例如,我们使用鸢尾花数据集,并且有两个 classes,setosa 和其他。我们把连续的Sepal.Width变量分成序数(5个bins),看看物种的分布:

data = iris
data$Species = factor(ifelse(data$Species=="setosa","setosa","others"))
tab = table(data$Species,cut(data$Sepal.Width,5))
barplot(sweep(tab,2,colSums(tab),"/"),
xlab="Sepal.Width ranges",ylab="Compostion of species",
col = c("lightblue","darkblue"))
legend("topright",fill=c("lightblue","darkblue"),rownames(tab),
xpd=TRUE, horiz=TRUE,inset=c(0,-0.3))

Sepal.width 的较高值由更多 "setosa" 物种主导。现在我们做 cdplot: