使用 R googleway 进行批量地理编码时出错

Error in batch geocoding using R googleway

不确定为什么我总是收到此错误:

值错误[3L]: 下载结果时出错。请在浏览器中手动检查以下 URL 是否有效。如果有效,请提交一份引用此 URL 的错误报告(注意:您的 API 密钥已被删除,因此您需要将其重新添加)

https://maps.googleapis.com/maps/api/geocode/json?&address=#211.+226+park+street,+brockville,+on,+k6v2h5&key=

 #A look at my dataframe called subset:

 ID<- c("XM-7393","XM-7138")
 Address<- c("175 College St #450, Toronto, ON M5T 1P7" ,"250 College St, Toronto, ON M5T 1R8")
 subset<-data.frame(ID,Address)
 subset$Address<- as.character(subset$Address)
  require(googleway) #using google to get coordinates
  gkey<-"INSERT GOOGLE API KEY HERE" #google API Key needed to get lat/lon coordinates

  #a lat and lon vector to store the coordinates from the geocode
  lat = vector("numeric", length = nrow(subset))
  lng = vector("numeric", length = nrow(subset))


  #Function for batch geocoding a list of addresses in a dataframe
  for (i in 1:nrow(subset)) {
  coord = googleway::google_geocode(subset$Address[i], key=gkey)

  if (coord$status == "OK") {
coord = googleway::geocode_coordinates(coord)
lat[i] = coord$lat[1]  # sometimes returns multiple coordinates
lng[i] = coord$lng[1]  # sometimes returns multiple coordinates
} else {
lat[i] = NA
lng[i] = NA
}

}



 #adding the lat and lon coordinates to subset dataset
  subset$lat = lat
  subset$lng = lng

好的,上面的代码有效!但前提是数据集没有那么多观察值。我使用的原始数据集有 1000 个观测值,我知道我没有接近我的 API 限制。所以不确定为什么当我有 1000 个观察数据集时它不起作用。

回答:一些地址字段有“#”来表示单元号。这需要删除(见下面的评论!)

您要检查您的地址中没有任何非法或保留字符,因为任何地理编码函数都将使用您的文本来创建 URLs 来查询地理编码 API . google_geocode 本身并没有提供非常有用的错误消息,但是通过查看您在上面发布的 URL,错误消息表明未包含必需的参数。

在这种情况下,# 在 URL 中有特殊含义,所以你会得到一个错误。仅供参考,我的 Google API 密钥保存为环境变量 GOOGLE_KEY:

library(googleway)

Address <- c("175 College St #450, Toronto, ON M5T 1P7", "250 College St, Toronto, ON M5T 1R8")
set_key(Sys.getenv("GOOGLE_KEY"))

geocode_results <- lapply(Address, google_geocode)
sapply(geocode_results, function(x) x[["status"]])
#> [1] "OVER_QUERY_LIMIT" "OK"

首地址有误;它还有一个 # 字符。保留字符列表在 including this language-agnostic SO question 左右。使用正则表达式模式,我将删除地址中可能存在的任何 #() 字符,然后再次尝试进行地理编码。

clean_addresses <- gsub(pattern = "[#\(\)]", replacement = "", Address)
geocode_cleaned <- lapply(clean_addresses, google_geocode)
sapply(geocode_cleaned, function(x) x[["status"]])
#> [1] "OK" "OK"