使用 R googleway 进行批量地理编码时出错
Error in batch geocoding using R googleway
不确定为什么我总是收到此错误:
值错误[3L]:
下载结果时出错。请在浏览器中手动检查以下 URL 是否有效。如果有效,请提交一份引用此 URL 的错误报告(注意:您的 API 密钥已被删除,因此您需要将其重新添加)
#A look at my dataframe called subset:
ID<- c("XM-7393","XM-7138")
Address<- c("175 College St #450, Toronto, ON M5T 1P7" ,"250 College St, Toronto, ON M5T 1R8")
subset<-data.frame(ID,Address)
subset$Address<- as.character(subset$Address)
require(googleway) #using google to get coordinates
gkey<-"INSERT GOOGLE API KEY HERE" #google API Key needed to get lat/lon coordinates
#a lat and lon vector to store the coordinates from the geocode
lat = vector("numeric", length = nrow(subset))
lng = vector("numeric", length = nrow(subset))
#Function for batch geocoding a list of addresses in a dataframe
for (i in 1:nrow(subset)) {
coord = googleway::google_geocode(subset$Address[i], key=gkey)
if (coord$status == "OK") {
coord = googleway::geocode_coordinates(coord)
lat[i] = coord$lat[1] # sometimes returns multiple coordinates
lng[i] = coord$lng[1] # sometimes returns multiple coordinates
} else {
lat[i] = NA
lng[i] = NA
}
}
#adding the lat and lon coordinates to subset dataset
subset$lat = lat
subset$lng = lng
好的,上面的代码有效!但前提是数据集没有那么多观察值。我使用的原始数据集有 1000 个观测值,我知道我没有接近我的 API 限制。所以不确定为什么当我有 1000 个观察数据集时它不起作用。
回答:一些地址字段有“#”来表示单元号。这需要删除(见下面的评论!)
您要检查您的地址中没有任何非法或保留字符,因为任何地理编码函数都将使用您的文本来创建 URLs 来查询地理编码 API . google_geocode
本身并没有提供非常有用的错误消息,但是通过查看您在上面发布的 URL,错误消息表明未包含必需的参数。
在这种情况下,#
在 URL 中有特殊含义,所以你会得到一个错误。仅供参考,我的 Google API 密钥保存为环境变量 GOOGLE_KEY
:
library(googleway)
Address <- c("175 College St #450, Toronto, ON M5T 1P7", "250 College St, Toronto, ON M5T 1R8")
set_key(Sys.getenv("GOOGLE_KEY"))
geocode_results <- lapply(Address, google_geocode)
sapply(geocode_results, function(x) x[["status"]])
#> [1] "OVER_QUERY_LIMIT" "OK"
首地址有误;它还有一个 #
字符。保留字符列表在 including this language-agnostic SO question 左右。使用正则表达式模式,我将删除地址中可能存在的任何 #
、(
或 )
字符,然后再次尝试进行地理编码。
clean_addresses <- gsub(pattern = "[#\(\)]", replacement = "", Address)
geocode_cleaned <- lapply(clean_addresses, google_geocode)
sapply(geocode_cleaned, function(x) x[["status"]])
#> [1] "OK" "OK"
不确定为什么我总是收到此错误:
值错误[3L]: 下载结果时出错。请在浏览器中手动检查以下 URL 是否有效。如果有效,请提交一份引用此 URL 的错误报告(注意:您的 API 密钥已被删除,因此您需要将其重新添加)
#A look at my dataframe called subset:
ID<- c("XM-7393","XM-7138")
Address<- c("175 College St #450, Toronto, ON M5T 1P7" ,"250 College St, Toronto, ON M5T 1R8")
subset<-data.frame(ID,Address)
subset$Address<- as.character(subset$Address)
require(googleway) #using google to get coordinates
gkey<-"INSERT GOOGLE API KEY HERE" #google API Key needed to get lat/lon coordinates
#a lat and lon vector to store the coordinates from the geocode
lat = vector("numeric", length = nrow(subset))
lng = vector("numeric", length = nrow(subset))
#Function for batch geocoding a list of addresses in a dataframe
for (i in 1:nrow(subset)) {
coord = googleway::google_geocode(subset$Address[i], key=gkey)
if (coord$status == "OK") {
coord = googleway::geocode_coordinates(coord)
lat[i] = coord$lat[1] # sometimes returns multiple coordinates
lng[i] = coord$lng[1] # sometimes returns multiple coordinates
} else {
lat[i] = NA
lng[i] = NA
}
}
#adding the lat and lon coordinates to subset dataset
subset$lat = lat
subset$lng = lng
好的,上面的代码有效!但前提是数据集没有那么多观察值。我使用的原始数据集有 1000 个观测值,我知道我没有接近我的 API 限制。所以不确定为什么当我有 1000 个观察数据集时它不起作用。
回答:一些地址字段有“#”来表示单元号。这需要删除(见下面的评论!)
您要检查您的地址中没有任何非法或保留字符,因为任何地理编码函数都将使用您的文本来创建 URLs 来查询地理编码 API . google_geocode
本身并没有提供非常有用的错误消息,但是通过查看您在上面发布的 URL,错误消息表明未包含必需的参数。
在这种情况下,#
在 URL 中有特殊含义,所以你会得到一个错误。仅供参考,我的 Google API 密钥保存为环境变量 GOOGLE_KEY
:
library(googleway)
Address <- c("175 College St #450, Toronto, ON M5T 1P7", "250 College St, Toronto, ON M5T 1R8")
set_key(Sys.getenv("GOOGLE_KEY"))
geocode_results <- lapply(Address, google_geocode)
sapply(geocode_results, function(x) x[["status"]])
#> [1] "OVER_QUERY_LIMIT" "OK"
首地址有误;它还有一个 #
字符。保留字符列表在 including this language-agnostic SO question 左右。使用正则表达式模式,我将删除地址中可能存在的任何 #
、(
或 )
字符,然后再次尝试进行地理编码。
clean_addresses <- gsub(pattern = "[#\(\)]", replacement = "", Address)
geocode_cleaned <- lapply(clean_addresses, google_geocode)
sapply(geocode_cleaned, function(x) x[["status"]])
#> [1] "OK" "OK"