ggvis:在单个图中组合多个数据集
ggvis: Combine multiple datasets in single plot
我已阅读 similar post on SO,但无法根据我的具体情况调整答案。我正在处理时间序列数据,想将两个不同的数据集组合到同一个图中。尽管我可以将数据合并到一个数据帧中,但我真的很想了解如何引用多个数据集。
模拟数据:
require(ggvis)
dfa <- data.frame(
date_a = seq(from= as.Date("2015-06-10"),
to= as.Date("2015-07-01"), by= 1),
val_a = c(2585.150, 2482.200, 3780.186, 3619.601,
0.000, 0.000, 3509.734, 3020.405,
3271.897, 3019.003, 3172.084, 0.000,
0.000, 3319.927, 2673.428, 3331.382,
3886.957, 2859.887, 0.000, 0.000,
2781.443, 2847.377) )
dfb <- data.frame(
date_b = seq(from= as.Date("2015-07-02"),
to= as.Date("2015-07-15"), by= 1),
val_b = c(3250.75429, 3505.43477, 3208.69141,
-2.08175, -27.30244, 3324.62348,
2820.91075, 3250.75429, 3505.43477,
3208.69141, -2.08175, -27.30244,
3324.62348, 2820.91075) )
使用上面提供的数据,我可以用下面的代码创建单独的图:
独立地块:(作品)
dfa %>%
ggvis( x= ~date_a , y= ~val_a, stroke := "black", opacity := 0.5 ) %>%
scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"),
as.Date("2015-07-15") )) %>%
layer_lines() %>% layer_points( fill := "black" )
dfb %>%
ggvis( x= ~date_b , y= ~val_b, stroke := "red", opacity := 0.5 ) %>%
scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"),
as.Date("2015-07-15") )) %>%
layer_lines() %>% layer_points( fill := "red" )
期望的输出是这两条线(黑色和红色)位于同一图上。以下是一些不成功的尝试:
尝试 #1 改编自 SO post:
ggvis( data = dfa, x = ~date_a, y = ~val_a) %>% layer_lines(stroke := "black", opacity := 0.5 ) %>%
layer_lines( data = dfb, x= ~date_b , y= ~val_b, stroke := "red",
opacity := 0.5 ) %>%
scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"),
as.Date("2015-07-15") ))
## Error in new_prop.default(x, property, scale, offset, mult, env, event, :
## Unknown input to prop: c(16618, 16619, 16620, 16621, 16622, 16623, 16624, ...
尝试 #2 基于 RStudio documentation:
ggvis( data = NULL, x = ~date_a, y = ~val_a) %>%
layer_lines(stroke := "black", opacity := 0.5, data = dfa ) %>%
layer_lines( x= ~date_b , y= ~val_b, stroke := "red",
opacity := 0.5, data = dfb ) %>%
scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"),
as.Date("2015-07-15") ))
## Error in func() : attempt to apply non-function
这是 ggplot2 中的简约实现:
require(ggplot2)
ggplot() +
geom_line(data = dfa, aes(x = date_a, y = val_a ), colour = "black") +
geom_line(data = dfb, aes(x = date_b, y = val_b ), colour = "red")
再次,我们将不胜感激一个可行的解决方案和简短的解释。预先感谢您的帮助。
嗯,看起来 layer_lines
可能不适合采用 data
参数。我认为您可以在这里成功使用 layer_paths
。它们的工作方式类似,但 layer_paths
按数据顺序工作,因此您需要确保在绘制之前正确排列时间序列。
首先,当我查看 layer_paths
基本函数时,它与许多其他层函数一样,具有特定的数据参数。
layer_paths
function (vis, ..., data = NULL)
{
add_mark(vis, "line", props(..., env = parent.frame()), data,
deparse2(substitute(data)))
}
<environment: namespace:ggvis>
虽然 layer_lines
有更多参数的 ...
,但它没有 data
参数,而且它似乎无法正常工作。
layer_lines
function (vis, ...)
{
x_var <- vis$cur_props$x$value
layer_f(vis, function(x) {
x <- auto_group(x, exclude = c("x", "y"))
x <- dplyr::arrange_(x, x_var)
emit_paths(x, props(...))
})
}
<environment: namespace:ggvis>
为了测试,我制作了一个非常基本的图表,试图在 layer_lines
中使用 data
参数。
ggvis() %>%
layer_lines(data = dfb, x= ~date_b , y= ~val_b, stroke := "red")
失败并出现错误。
Error in func() : attempt to apply non-function
下面是使用 layer_paths
的相同代码:
ggvis() %>%
layer_paths(data = dfb, x= ~date_b , y= ~val_b, stroke := "red")
所以,这行得通,这意味着只要您按日期订购数据集,您的图形应该可以正常工作,只需将 layer_lines
替换为 layer_paths
。
ggvis(data = dfa, x = ~date_a, y = ~val_a) %>%
layer_paths(stroke := "black", opacity := 0.5 ) %>%
layer_paths(data = dfb, x = ~date_b , y= ~val_b, stroke := "red",
opacity := 0.5 ) %>%
scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"), as.Date("2015-07-15") ))
这对我来说似乎很奇怪,我错过了一些东西。我在 ggvis
github page 上的未解决或已解决问题中没有看到任何内容,您可以考虑提交一个。
我已阅读 similar post on SO,但无法根据我的具体情况调整答案。我正在处理时间序列数据,想将两个不同的数据集组合到同一个图中。尽管我可以将数据合并到一个数据帧中,但我真的很想了解如何引用多个数据集。
模拟数据:
require(ggvis)
dfa <- data.frame(
date_a = seq(from= as.Date("2015-06-10"),
to= as.Date("2015-07-01"), by= 1),
val_a = c(2585.150, 2482.200, 3780.186, 3619.601,
0.000, 0.000, 3509.734, 3020.405,
3271.897, 3019.003, 3172.084, 0.000,
0.000, 3319.927, 2673.428, 3331.382,
3886.957, 2859.887, 0.000, 0.000,
2781.443, 2847.377) )
dfb <- data.frame(
date_b = seq(from= as.Date("2015-07-02"),
to= as.Date("2015-07-15"), by= 1),
val_b = c(3250.75429, 3505.43477, 3208.69141,
-2.08175, -27.30244, 3324.62348,
2820.91075, 3250.75429, 3505.43477,
3208.69141, -2.08175, -27.30244,
3324.62348, 2820.91075) )
使用上面提供的数据,我可以用下面的代码创建单独的图:
独立地块:(作品)
dfa %>%
ggvis( x= ~date_a , y= ~val_a, stroke := "black", opacity := 0.5 ) %>%
scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"),
as.Date("2015-07-15") )) %>%
layer_lines() %>% layer_points( fill := "black" )
dfb %>%
ggvis( x= ~date_b , y= ~val_b, stroke := "red", opacity := 0.5 ) %>%
scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"),
as.Date("2015-07-15") )) %>%
layer_lines() %>% layer_points( fill := "red" )
期望的输出是这两条线(黑色和红色)位于同一图上。以下是一些不成功的尝试:
尝试 #1 改编自 SO post:
ggvis( data = dfa, x = ~date_a, y = ~val_a) %>% layer_lines(stroke := "black", opacity := 0.5 ) %>%
layer_lines( data = dfb, x= ~date_b , y= ~val_b, stroke := "red",
opacity := 0.5 ) %>%
scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"),
as.Date("2015-07-15") ))
## Error in new_prop.default(x, property, scale, offset, mult, env, event, :
## Unknown input to prop: c(16618, 16619, 16620, 16621, 16622, 16623, 16624, ...
尝试 #2 基于 RStudio documentation:
ggvis( data = NULL, x = ~date_a, y = ~val_a) %>%
layer_lines(stroke := "black", opacity := 0.5, data = dfa ) %>%
layer_lines( x= ~date_b , y= ~val_b, stroke := "red",
opacity := 0.5, data = dfb ) %>%
scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"),
as.Date("2015-07-15") ))
## Error in func() : attempt to apply non-function
这是 ggplot2 中的简约实现:
require(ggplot2)
ggplot() +
geom_line(data = dfa, aes(x = date_a, y = val_a ), colour = "black") +
geom_line(data = dfb, aes(x = date_b, y = val_b ), colour = "red")
再次,我们将不胜感激一个可行的解决方案和简短的解释。预先感谢您的帮助。
嗯,看起来 layer_lines
可能不适合采用 data
参数。我认为您可以在这里成功使用 layer_paths
。它们的工作方式类似,但 layer_paths
按数据顺序工作,因此您需要确保在绘制之前正确排列时间序列。
首先,当我查看 layer_paths
基本函数时,它与许多其他层函数一样,具有特定的数据参数。
layer_paths
function (vis, ..., data = NULL)
{
add_mark(vis, "line", props(..., env = parent.frame()), data,
deparse2(substitute(data)))
}
<environment: namespace:ggvis>
虽然 layer_lines
有更多参数的 ...
,但它没有 data
参数,而且它似乎无法正常工作。
layer_lines
function (vis, ...)
{
x_var <- vis$cur_props$x$value
layer_f(vis, function(x) {
x <- auto_group(x, exclude = c("x", "y"))
x <- dplyr::arrange_(x, x_var)
emit_paths(x, props(...))
})
}
<environment: namespace:ggvis>
为了测试,我制作了一个非常基本的图表,试图在 layer_lines
中使用 data
参数。
ggvis() %>%
layer_lines(data = dfb, x= ~date_b , y= ~val_b, stroke := "red")
失败并出现错误。
Error in func() : attempt to apply non-function
下面是使用 layer_paths
的相同代码:
ggvis() %>%
layer_paths(data = dfb, x= ~date_b , y= ~val_b, stroke := "red")
所以,这行得通,这意味着只要您按日期订购数据集,您的图形应该可以正常工作,只需将 layer_lines
替换为 layer_paths
。
ggvis(data = dfa, x = ~date_a, y = ~val_a) %>%
layer_paths(stroke := "black", opacity := 0.5 ) %>%
layer_paths(data = dfb, x = ~date_b , y= ~val_b, stroke := "red",
opacity := 0.5 ) %>%
scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"), as.Date("2015-07-15") ))
这对我来说似乎很奇怪,我错过了一些东西。我在 ggvis
github page 上的未解决或已解决问题中没有看到任何内容,您可以考虑提交一个。