highcharter hcaes "group" 使用 highchart2() 绘制大量数据时的用法
highcharter hcaes "group" usage while plotting large amounts of data with highchart2()
我正在尝试使用 highcharter 包(> 50k 行数据)在散点图中绘制大型数据集,经过一些阅读后我发现 highchart2()
函数包含 highcharts 的 boost 模块,这应该会提高性能绘制大量数据时很多。举个例子:
library(highcharter) # I'm using the latest version from github (0.5.0.9999)
x <- data.frame(a = rnorm(5000),
b = rnorm(5000),
cat = c(rep("Yes", 2500), rep("No",2500)))
highchart() %>%
hc_add_series(data = x, type = "scatter", hcaes(x=a, y=b, group=cat))
这应该可以正确创建散点图,但由于数据量的原因已经存在一些性能问题。这就是我切换到 highchart2()
的原因,但令我惊讶的是,该图在尝试时没有显示任何数据点:
highchart2() %>%
hc_add_series(data = x, type = "scatter", hcaes(x=a, y=b, group=cat))
经过更多的搜索和阅读,我发现使用 list_parse2()
时绘图的渲染速度要快得多,所以我尝试了这个:
highchart2() %>%
hc_add_series(data = list_parse2(x), type = "scatter", hcaes(x=a, y=b, group=cat))
当然它不起作用,因为我更改了输入数据的结构,并删除了我提供给 hcaes()
的变量的名称。然后,当我尝试这个时:
highchart2() %>%
hc_add_series(data = list_parse2(x), type = "scatter")
我得到了一个非常快速的渲染图,但是我无法在每个点进行区分 "Yes" 和 "No" 的分组工作,所以所有点现在都是相同的颜色。
所以我的问题是,如何在保持将变量分配给 hcaes()
中的 "group" 参数的同时有效地绘制具有 highcharter 的大型数据集?
在此先感谢您的帮助。
迷你免责声明:hcaes
仅在 data
对象是 data.frame
时有效。
现在,您可以使用 dplyr
,使用 group_by
函数获取一系列数据框,然后使用辅助函数 hc_add_series_list
同时添加多个系列。
library(highcharter) # I'm using the latest version from github (0.5.0.9999)
x <- data.frame(a = rnorm(5000), b = rnorm(5000), cat = c(rep("Yes", 2500),
rep("No", 2500)))
library(dplyr)
xseries <- x %>%
# use `name` to name series according the value of `cat` avariable
group_by(name = cat) %>%
do(data = list_parse2(.)) %>%
# add type of series
mutate(type = "scatter")
# A data frame of series
xseries
#> Source: local data frame [2 x 3]
#> Groups: <by row>
#>
#> # A tibble: 2 x 3
#> name data type
#> <fctr> <list> <chr>
#> 1 No <list [2,500]> scatter
#> 2 Yes <list [2,500]> scatter
最后:
highchart2() %>%
hc_add_series_list(xseries)
我正在尝试使用 highcharter 包(> 50k 行数据)在散点图中绘制大型数据集,经过一些阅读后我发现 highchart2()
函数包含 highcharts 的 boost 模块,这应该会提高性能绘制大量数据时很多。举个例子:
library(highcharter) # I'm using the latest version from github (0.5.0.9999)
x <- data.frame(a = rnorm(5000),
b = rnorm(5000),
cat = c(rep("Yes", 2500), rep("No",2500)))
highchart() %>%
hc_add_series(data = x, type = "scatter", hcaes(x=a, y=b, group=cat))
这应该可以正确创建散点图,但由于数据量的原因已经存在一些性能问题。这就是我切换到 highchart2()
的原因,但令我惊讶的是,该图在尝试时没有显示任何数据点:
highchart2() %>%
hc_add_series(data = x, type = "scatter", hcaes(x=a, y=b, group=cat))
经过更多的搜索和阅读,我发现使用 list_parse2()
时绘图的渲染速度要快得多,所以我尝试了这个:
highchart2() %>%
hc_add_series(data = list_parse2(x), type = "scatter", hcaes(x=a, y=b, group=cat))
当然它不起作用,因为我更改了输入数据的结构,并删除了我提供给 hcaes()
的变量的名称。然后,当我尝试这个时:
highchart2() %>%
hc_add_series(data = list_parse2(x), type = "scatter")
我得到了一个非常快速的渲染图,但是我无法在每个点进行区分 "Yes" 和 "No" 的分组工作,所以所有点现在都是相同的颜色。
所以我的问题是,如何在保持将变量分配给 hcaes()
中的 "group" 参数的同时有效地绘制具有 highcharter 的大型数据集?
在此先感谢您的帮助。
迷你免责声明:hcaes
仅在 data
对象是 data.frame
时有效。
现在,您可以使用 dplyr
,使用 group_by
函数获取一系列数据框,然后使用辅助函数 hc_add_series_list
同时添加多个系列。
library(highcharter) # I'm using the latest version from github (0.5.0.9999)
x <- data.frame(a = rnorm(5000), b = rnorm(5000), cat = c(rep("Yes", 2500),
rep("No", 2500)))
library(dplyr)
xseries <- x %>%
# use `name` to name series according the value of `cat` avariable
group_by(name = cat) %>%
do(data = list_parse2(.)) %>%
# add type of series
mutate(type = "scatter")
# A data frame of series
xseries
#> Source: local data frame [2 x 3]
#> Groups: <by row>
#>
#> # A tibble: 2 x 3
#> name data type
#> <fctr> <list> <chr>
#> 1 No <list [2,500]> scatter
#> 2 Yes <list [2,500]> scatter
最后:
highchart2() %>%
hc_add_series_list(xseries)