在 R 中,如何求和行之间的距离(每一行都是一个 GPS 坐标)?
In R, how to sum the distance between rows (each one is a GPS coordinate)?
我有很多 GPS 点,我想要的是给定日期内两个后续点(行)之间的距离总和,这样我就可以获得每天的轨迹距离。
每天大约有 200 个 GPS 点。后续点表示第一行早于第二行的两行。因为我需要这些点之间的总距离,所以它必须考虑给定日期内 "time" 列("date" 列)的行顺序。
谢谢!
我的 table 大概是这样的:
date time lat lon
18-Jan-18 12:48:39 -24.061464 -47.99523
18-Jan-18 12:48:48 -24.06163 -47.995354
18-Jan-18 12:53:17 -24.06175 -47.995277
我们可以使用包raster
中的pointDistance
来计算距离。 dplyr
中的 lag
将有助于计算后续点。 replace_na
来自 tidyr
非常方便,但您可以使用自己喜欢的方式处理 NA
。
library(raster)
library(dplyr)
library(tidyr)
data %>%
mutate(Distance = pointDistance(cbind(lon,lat),cbind(lag(lon),lag(lat)),lonlat = TRUE)) %>%
mutate(TotalDistance = cumsum(replace_na(Distance,0)))
# date time lat lon Distance TotalDistance
#1 18-Jan-18 12:48:39 -24.06146 -47.99523 NA 0.00000
#2 18-Jan-18 12:48:48 -24.06163 -47.99535 22.29547 22.29547
#3 18-Jan-18 12:53:17 -24.06175 -47.99528 15.42660 37.72207
数据
data <- structure(list(date = structure(c(1L, 1L, 1L), .Label = "18-Jan-18", class = "factor"),
time = structure(1:3, .Label = c("12:48:39", "12:48:48",
"12:53:17"), class = "factor"), lat = c(-24.061464, -24.06163,
-24.06175), lon = c(-47.99523, -47.995354, -47.995277)), class = "data.frame", row.names = c(NA,
-3L))
我有很多 GPS 点,我想要的是给定日期内两个后续点(行)之间的距离总和,这样我就可以获得每天的轨迹距离。
每天大约有 200 个 GPS 点。后续点表示第一行早于第二行的两行。因为我需要这些点之间的总距离,所以它必须考虑给定日期内 "time" 列("date" 列)的行顺序。
谢谢!
我的 table 大概是这样的:
date time lat lon
18-Jan-18 12:48:39 -24.061464 -47.99523
18-Jan-18 12:48:48 -24.06163 -47.995354
18-Jan-18 12:53:17 -24.06175 -47.995277
我们可以使用包raster
中的pointDistance
来计算距离。 dplyr
中的 lag
将有助于计算后续点。 replace_na
来自 tidyr
非常方便,但您可以使用自己喜欢的方式处理 NA
。
library(raster)
library(dplyr)
library(tidyr)
data %>%
mutate(Distance = pointDistance(cbind(lon,lat),cbind(lag(lon),lag(lat)),lonlat = TRUE)) %>%
mutate(TotalDistance = cumsum(replace_na(Distance,0)))
# date time lat lon Distance TotalDistance
#1 18-Jan-18 12:48:39 -24.06146 -47.99523 NA 0.00000
#2 18-Jan-18 12:48:48 -24.06163 -47.99535 22.29547 22.29547
#3 18-Jan-18 12:53:17 -24.06175 -47.99528 15.42660 37.72207
数据
data <- structure(list(date = structure(c(1L, 1L, 1L), .Label = "18-Jan-18", class = "factor"),
time = structure(1:3, .Label = c("12:48:39", "12:48:48",
"12:53:17"), class = "factor"), lat = c(-24.061464, -24.06163,
-24.06175), lon = c(-47.99523, -47.995354, -47.995277)), class = "data.frame", row.names = c(NA,
-3L))