转换地理坐标
Converting geographic coordinates
我有一个 CSV 地点,地理坐标采用度分秒格式,但没有像这样的分隔符:
df <- data.frame(name = c("farm_1", "farm_2", "seabrook_1", "rocks_road"),
lat = c(425319.3, 425317, 425317.1, 425323.3),
long = c(705045.5, 705101.1, 705145.4, 705219.8))
name long lat
farm_1 425319.3 705045.5
farm_2 425317 705101.1
seabrook_1 425317.1 705145.4
rocks_road 425323.3 705219.8
我有另一个 CSV 地理坐标,格式如下:
df_2 <- data.frame(name = c("exeter_road", "hampton_hill", "portsmouth_ave", "pebble_ln"),
GPS_cordinates_DMM = c("N42 58.855 W70 56.473", "N42 58.666 W70 54.981",
"N42 56.579 W70 52.550", "N42 55.949 W70 53.631"))
name GPS_cordinates_DMM
exeter_road N42 58.855 W70 56.473
hampton_hill N42 58.666 W70 54.981
portsmouth_ave N42 56.579 W70 52.550
pebble_ln N42 55.949 W70 53.631
我想解析每个数据框中的坐标并将它们转换为十进制经纬度。例如,第一个数据框如下所示:
df_dec <- data.frame(name = c("farm_1", "farm_2", "seabrook_1", "rocks_road"),
latitude = c(42.88869444, 42.88805556, 42.88808333, 42.88980556),
longitude = c(70.84597222, 70.85030556, 70.86261111, 70.87216667))
name latitude longitude
farm_1 42.88869 70.84597
farm_2 42.88806 70.85031
seabrook_1 42.88808 70.86261
rocks_road 42.88981 70.87217
第二个数据框如下所示:
df_2_dec <- df_2 <- data.frame(name = c("exeter_road", "hampton_hill", "portsmouth_ave", "pebble_ln"),
latitude = c(42.98091667, 42.97776667, 42.94298333, 42.93248333),
longitude = c(70.94121667, 70.91635, 70.87583333, 70.89385))
name latitude longitude
exeter_road 42.98092 70.94122
hampton_hill 42.97777 70.91635
portsmouth_ave. 42.94298 70.87583
pebble_ln 42.93248 70.89385
然后我最终可以合并 map/analyze 它们。
有没有可以解析和转换这些坐标类型的包或函数?
如果没有,您如何推荐编写一个健壮的并且可以处理诸如第一个数据集第二行的纬度中没有小数点之类的问题?
使用substr
你可以根据字符串的位置(substring
所以不需要结束位置)从字符串中刮取度、分、秒的数值,把它们变成数值和计算。
f1 <- function(x) (as.numeric(substr(x, 1, 2))*60^2 + as.numeric(substr(x, 3, 4))*60 +
as.numeric(substring(x, 5)))/60^2
res1 <- data.frame(name=df$name, lapply(df[-1], f1))
res1
# name lat long
# 1 farm_1 42.88869 70.84597
# 2 farm_2 42.88806 70.85031
# 3 seabrook_1 42.88808 70.86261
# 4 rocks_road 42.88981 70.87217
我们可以在 N、S、E 或 W 处分割第二个样本,使用 strsplit
,基本上与第一个样本相同。
tmp <- as.data.frame(
gsub("\D", "", do.call(rbind, strsplit(df_2$GPS_cordinates_DMM, "[NSEW]"))[,-1]))
f2 <- function(x) as.numeric(substr(x, 1, 2)) +
as.numeric(substring(x, 3))/1e3/60
res2 <- data.frame(name=df_2$name, setNames(lapply(tmp, f2), c("lat", "lon")))
res2
# name lat lon
# 1 exeter_road 42.98092 70.94122
# 2 hampton_hill 42.97777 70.91635
# 3 portsmouth_ave 42.94298 70.87583
# 4 pebble_ln 42.93248 70.89385
我有一个 CSV 地点,地理坐标采用度分秒格式,但没有像这样的分隔符:
df <- data.frame(name = c("farm_1", "farm_2", "seabrook_1", "rocks_road"),
lat = c(425319.3, 425317, 425317.1, 425323.3),
long = c(705045.5, 705101.1, 705145.4, 705219.8))
name long lat
farm_1 425319.3 705045.5
farm_2 425317 705101.1
seabrook_1 425317.1 705145.4
rocks_road 425323.3 705219.8
我有另一个 CSV 地理坐标,格式如下:
df_2 <- data.frame(name = c("exeter_road", "hampton_hill", "portsmouth_ave", "pebble_ln"),
GPS_cordinates_DMM = c("N42 58.855 W70 56.473", "N42 58.666 W70 54.981",
"N42 56.579 W70 52.550", "N42 55.949 W70 53.631"))
name GPS_cordinates_DMM
exeter_road N42 58.855 W70 56.473
hampton_hill N42 58.666 W70 54.981
portsmouth_ave N42 56.579 W70 52.550
pebble_ln N42 55.949 W70 53.631
我想解析每个数据框中的坐标并将它们转换为十进制经纬度。例如,第一个数据框如下所示:
df_dec <- data.frame(name = c("farm_1", "farm_2", "seabrook_1", "rocks_road"),
latitude = c(42.88869444, 42.88805556, 42.88808333, 42.88980556),
longitude = c(70.84597222, 70.85030556, 70.86261111, 70.87216667))
name latitude longitude
farm_1 42.88869 70.84597
farm_2 42.88806 70.85031
seabrook_1 42.88808 70.86261
rocks_road 42.88981 70.87217
第二个数据框如下所示:
df_2_dec <- df_2 <- data.frame(name = c("exeter_road", "hampton_hill", "portsmouth_ave", "pebble_ln"),
latitude = c(42.98091667, 42.97776667, 42.94298333, 42.93248333),
longitude = c(70.94121667, 70.91635, 70.87583333, 70.89385))
name latitude longitude
exeter_road 42.98092 70.94122
hampton_hill 42.97777 70.91635
portsmouth_ave. 42.94298 70.87583
pebble_ln 42.93248 70.89385
然后我最终可以合并 map/analyze 它们。
有没有可以解析和转换这些坐标类型的包或函数?
如果没有,您如何推荐编写一个健壮的并且可以处理诸如第一个数据集第二行的纬度中没有小数点之类的问题?
使用substr
你可以根据字符串的位置(substring
所以不需要结束位置)从字符串中刮取度、分、秒的数值,把它们变成数值和计算。
f1 <- function(x) (as.numeric(substr(x, 1, 2))*60^2 + as.numeric(substr(x, 3, 4))*60 +
as.numeric(substring(x, 5)))/60^2
res1 <- data.frame(name=df$name, lapply(df[-1], f1))
res1
# name lat long
# 1 farm_1 42.88869 70.84597
# 2 farm_2 42.88806 70.85031
# 3 seabrook_1 42.88808 70.86261
# 4 rocks_road 42.88981 70.87217
我们可以在 N、S、E 或 W 处分割第二个样本,使用 strsplit
,基本上与第一个样本相同。
tmp <- as.data.frame(
gsub("\D", "", do.call(rbind, strsplit(df_2$GPS_cordinates_DMM, "[NSEW]"))[,-1]))
f2 <- function(x) as.numeric(substr(x, 1, 2)) +
as.numeric(substring(x, 3))/1e3/60
res2 <- data.frame(name=df_2$name, setNames(lapply(tmp, f2), c("lat", "lon")))
res2
# name lat lon
# 1 exeter_road 42.98092 70.94122
# 2 hampton_hill 42.97777 70.91635
# 3 portsmouth_ave 42.94298 70.87583
# 4 pebble_ln 42.93248 70.89385