转换地理坐标

Converting geographic coordinates

我有一个 CSV 地点,地理坐标采用度分秒格式,但没有像这样的分隔符:

df <- data.frame(name = c("farm_1", "farm_2", "seabrook_1", "rocks_road"),
                 lat = c(425319.3, 425317, 425317.1, 425323.3), 
                 long = c(705045.5, 705101.1, 705145.4, 705219.8))


name          long       lat
farm_1        425319.3   705045.5 
farm_2        425317     705101.1
seabrook_1    425317.1   705145.4
rocks_road    425323.3   705219.8

我有另一个 CSV 地理坐标,格式如下:

df_2 <- data.frame(name = c("exeter_road", "hampton_hill", "portsmouth_ave", "pebble_ln"), 
                   GPS_cordinates_DMM = c("N42 58.855 W70 56.473", "N42 58.666 W70 54.981", 
                                          "N42 56.579 W70 52.550", "N42 55.949 W70 53.631"))


name           GPS_cordinates_DMM
exeter_road    N42 58.855 W70 56.473
hampton_hill   N42 58.666 W70 54.981
portsmouth_ave N42 56.579 W70 52.550
pebble_ln      N42 55.949 W70 53.631

我想解析每个数据框中的坐标并将它们转换为十进制经纬度。例如,第一个数据框如下所示:

df_dec <- data.frame(name = c("farm_1", "farm_2", "seabrook_1", "rocks_road"), 
                 latitude = c(42.88869444,  42.88805556, 42.88808333, 42.88980556),
                 longitude = c(70.84597222, 70.85030556, 70.86261111, 70.87216667))
   name     latitude  longitude
  farm_1     42.88869  70.84597
  farm_2     42.88806  70.85031
  seabrook_1 42.88808  70.86261
  rocks_road 42.88981  70.87217

第二个数据框如下所示:

df_2_dec <- df_2 <- data.frame(name = c("exeter_road", "hampton_hill", "portsmouth_ave", "pebble_ln"), 
                           latitude = c(42.98091667, 42.97776667, 42.94298333, 42.93248333), 
                           longitude = c(70.94121667,   70.91635, 70.87583333, 70.89385))


name            latitude  longitude
exeter_road     42.98092  70.94122
hampton_hill    42.97777  70.91635
portsmouth_ave. 42.94298  70.87583
pebble_ln       42.93248  70.89385

然后我最终可以合并 map/analyze 它们。

有没有可以解析和转换这些坐标类型的包或函数?

如果没有,您如何推荐编写一个健壮的并且可以处理诸如第一个数据集第二行的纬度中没有小数点之类的问题?

使用substr你可以根据字符串的位置(substring所以不需要结束位置)从字符串中刮取度、分、秒的数值,把它们变成数值和计算。

f1 <- function(x) (as.numeric(substr(x, 1, 2))*60^2 + as.numeric(substr(x, 3, 4))*60 + 
                     as.numeric(substring(x, 5)))/60^2

res1 <- data.frame(name=df$name, lapply(df[-1], f1))
res1
#         name      lat     long
# 1     farm_1 42.88869 70.84597
# 2     farm_2 42.88806 70.85031
# 3 seabrook_1 42.88808 70.86261
# 4 rocks_road 42.88981 70.87217

我们可以在 N、S、E 或 W 处分割第二个样本,使用 strsplit,基本上与第一个样本相同。

tmp <- as.data.frame(
  gsub("\D", "", do.call(rbind, strsplit(df_2$GPS_cordinates_DMM, "[NSEW]"))[,-1]))
f2 <- function(x) as.numeric(substr(x, 1, 2)) + 
  as.numeric(substring(x, 3))/1e3/60
res2 <- data.frame(name=df_2$name, setNames(lapply(tmp, f2), c("lat", "lon")))
res2
#             name      lat      lon
# 1    exeter_road 42.98092 70.94122
# 2   hampton_hill 42.97777 70.91635
# 3 portsmouth_ave 42.94298 70.87583
# 4      pebble_ln 42.93248 70.89385