将非常规格式的度数坐标转换为十进制度数

Converting coordinates from degree with unconventional format to decimal degree

我正在尝试转换我的数据,以便可以将其绘制在地图上。例如数据如下:

# A tibble: 2 x 2
  Latitud           Longitud        
  <chr>             <chr>           
1 10º 35' 28.98'' N 3º 41' 33.91'' O
2 10º 35' 12.63'' N 3º 45' 46.22'' O

我正在尝试使用以下方法对其进行变异:

df %>% 
  mutate(
    Latitud = str_replace_all(Latitud, "''", ""),
    lat_edit = sp::char2dms(Latitud), "°")

其中 returns 和错误:

Error in if (any(abs(object@deg) > 90)) return("abs(degree) > 90") : 
  missing value where TRUE/FALSE needed
In addition: Warning message:
In asMethod(object) : NAs introduced by coercion

我想在 ggplot(或其他空间包)的地图上绘制这两个点

数据:

structure(list(Latitud = c("40º 25' 25.98'' N", "40º 25' 17.63'' N"
), Longitud = c("3º 42' 43.91'' O", "3º 40' 56.22'' O")), class = c("tbl_df", 
"tbl", "data.frame"), row.names = c(NA, -2L))

您可以使用以下自定义函数(我假设 NSWE。不确定 O 在经度):

angle2dec <- function(angle) {
  angle <- as.character(angle)
  angle <- ifelse(grepl("S|W", angle), paste0("-", angle), angle)
  angle <- trimws(gsub("[^- +.0-9]", "", angle))
  x <- do.call(rbind, strsplit(angle, split=' '))
  x <- apply(x, 1L, function(y) {
    y <- as.numeric(y)
    (abs(y[1]) + y[2]/60 + y[3]/3600) * sign(y[1])
  })
  return(x)
}

在数据上应用:

df1[] <- lapply(df1, angle2dec)

df1
#>     Latitud  Longitud
#> 1 -40.42388  3.712197
#> 2  40.42156 -3.682283

绘图:

library(ggplot2)

ggplot(df1, aes(x = Longitud, y = Latitud)) +
  geom_point()


略微修改数据以显示不同半球:

df1 <- structure(list(Latitud = c("40<U+623C><U+3E61> 25' 25.98'' S", 
                                  "40<U+623C><U+3E61> 25' 17.63'' N"), 
                      Longitud = c("3<U+623C><U+3E61> 42' 43.91'' E",
                                   "3<U+623C><U+3E61> 40' 56.22'' W")), 
                 class = c("tbl_df", "tbl", "data.frame"), 
                 row.names = c(NA, -2L))

参照Converting geo coordinates from degree to decimal .

我会先说我直到现在才使用 char2dms,所以我可能遗漏了一些复杂的问题(比如我上面关于 "O" 作为方向的问题)。查看文档和示例,您需要给出用于划分度、分和秒的字符。在您的例子中,它们分别是 "º""'""''"。我跳过了删除其中第三个的步骤,因为有必要查看秒数的写入位置。 (更新: 添加了将正则表达式 "O$" (oeste) 替换为 "W" (west) 的步骤。这让你得到以下内容:

library(dplyr)
library(ggplot2)
library(sp)

dat <- structure(list(Latitud = c("40º 25' 25.98'' N", "40º 25' 17.63'' N"
), Longitud = c("3º 42' 43.91'' O", "3º 40' 56.22'' O")), class = c("tbl_df", 
                                                                    "tbl", "data.frame"), row.names = c(NA, -2L)) %>%
  mutate_at(vars(Latitud, Longitud), stringr::str_replace_all, "O$", "W")

char2dms(dat$Latitud, chd = "º", chm = "'", chs = "''")
#> [1] 40d25'25.98"N 40d25'17.63"N

这是一个 DMS S3 对象,而不是向量(我的知识到此为止),因此您不能将它直接放入数据框列中。相反,转换为数字向量,您的数据框中就有了数字坐标。

dat_numeric <- dat %>%
  mutate(lat_edit = as.numeric(char2dms(dat$Latitud, chd = "º", chm = "'", chs = "''")),
         lon_edit = as.numeric(char2dms(dat$Longitud, chd = "º", chm = "'", chs = "''")))

dat_numeric
#> # A tibble: 2 x 4
#>   Latitud           Longitud         lat_edit lon_edit
#>   <chr>             <chr>               <dbl>    <dbl>
#> 1 40º 25' 25.98'' N 3º 42' 43.91'' W     40.4    -3.71
#> 2 40º 25' 17.63'' N 3º 40' 56.22'' W     40.4    -3.68

像正常数字一样绘制:

ggplot(dat_numeric, aes(x = lon_edit, y = lat_edit)) +
  geom_point()

或转换为 sf 对象并使用适当的纵横比、投影等进行绘图

sf::st_as_sf(dat_numeric, coords = c("lon_edit", "lat_edit")) %>%
  ggplot() +
  geom_sf()