R 中具有 2 个分类变量和 1 个连续变量的折线图

line graph with 2 categorical variables and 1 continuous in R

总的来说,我对 R 和统计数据还很陌生。我正在尝试在 ggplot2.

中绘制折线图 2 个分类变量(词性 "pos"、条件 "trcond")和一个数值变量(分数 "totacc")
> df1<-df[, c("trcond", "subtitle", "pos", "totacc")]
> head(df1)
   trcond     subtitle pos totacc
7       L New Scene_16 lex  0.250
29      N New Scene_16 lex  0.500
8       L New Scene_25 lex  0.875
30      N New Scene_25 lex  0.666
9       L New Scene_29 lex  1.000
31      N New Scene_29 lex  0.833

我用过这个 ggplot2 命令:

>ggplot(data=summdfo, aes(x=pos, y=totacc, group=trcond, colour=trcond))
+ geom_line() + geom_point()

但它不起作用,图表到处都是彩色(蓝色和红色)点,并且不仅仅是两条线连接它们。我想 post 我得到的图表,因为我缺乏文字来解释,但这是我的第一个 post,我似乎无法上传图片。

我想要一个标准的简单 2 线图,例如本页中的蓝色和红色(其中 y = 总账单,按 x = 时间(午餐,晚餐)按性别分组):http://www.cookbook-r.com/Graphs/Bar_and_line_graphs_%28ggplot2%29/

这对我的数据集是否可行?如果是这样,我的代码有什么问题?

在这里,我尝试根据您数据中的有限样本创建一个数据框。

df1 <- data.frame(trcond=rep(c('L', 'N'), 3), 
                  subtitle=rep('New Scene_29', 6),  # Not in use, just a dummy
                  pos=c('lex', 'lex', 'lex', 'noLex', 'noLex', 'noLex'), 
                  totacc=c(0.250, 0.5, 0.875, 0.666, 1.000, 0.833))

因为 trcond by pos 在这个数据框中不平衡,所以情节会像这样混乱:

ggplot(data=df1, aes(x=pos, y=totacc, group=trcond, color=trcond))+ 
  geom_line() + 
  geom_point()

但是,如果您应用汇总函数来计算每个条件的均值,则会出现正确的图:

ggplot(data=df1, aes(x=pos, y=totacc, group=trcond, color=trcond))+ 
  geom_line(stat='summary', fun.y='mean') + 
  geom_point(stat='summary', fun.y='mean')

同样,这是试图找出数据中的内容。最好的是,您在此处提供了使用 dput(head(df1, 50)) 的数据样本,以便为您提供更好的答案。