用于根据提交的字符串推断 country/location 的库或 API?
Library or API for inferring country/location based on submitted string?
我正在追溯清理 Offer Drive 产品 (http://offerletter.io/drive.html) 的大量数据。我正在尝试规范化自由格式 "location" 字段以确定提交的位置是否位于美国。
值的粒度可能不同,但都是 "real",例如
San Francisco, CA
Milwaukee
Bangalore
我的问题是,是否有一种好方法(某些 API 或库)可以根据用户提交的字符串智能地规范化这些字符串,这样我可以说:
normalized = GeoNormalize.normalize("San Francisco")
return normalized.country() == "United States"
我真的很喜欢 chronyk
( https://github.com/KoffeinFlummi/Chronyk ),而且对于位置来说类似的东西会很棒。
有很多,通常由制图或 GIS 供应商提供。
例如,Google 地理编码服务接受一个字符串和 returns 一组标准格式的排名位置:
https://developers.google.com/maps/documentation/geocoding/?csw=1#Geocoding
雅虎也有一个:
https://developer.yahoo.com/boss/geo/#overview
就像我说的,有很多很多。它们通常在轻度使用时免费,但在一定时间后会产生使用费。
尝试geograpy。
如果您使用 python 3.x 并在安装过程中遇到问题,请尝试:
python3 -m pip3 install git+https://github.com/reach2ashish/geograpy.git
python3 geograpy-nltk
我正在追溯清理 Offer Drive 产品 (http://offerletter.io/drive.html) 的大量数据。我正在尝试规范化自由格式 "location" 字段以确定提交的位置是否位于美国。
值的粒度可能不同,但都是 "real",例如
San Francisco, CA
Milwaukee
Bangalore
我的问题是,是否有一种好方法(某些 API 或库)可以根据用户提交的字符串智能地规范化这些字符串,这样我可以说:
normalized = GeoNormalize.normalize("San Francisco")
return normalized.country() == "United States"
我真的很喜欢 chronyk
( https://github.com/KoffeinFlummi/Chronyk ),而且对于位置来说类似的东西会很棒。
有很多,通常由制图或 GIS 供应商提供。
例如,Google 地理编码服务接受一个字符串和 returns 一组标准格式的排名位置:
https://developers.google.com/maps/documentation/geocoding/?csw=1#Geocoding
雅虎也有一个:
https://developer.yahoo.com/boss/geo/#overview
就像我说的,有很多很多。它们通常在轻度使用时免费,但在一定时间后会产生使用费。
尝试geograpy。
如果您使用 python 3.x 并在安装过程中遇到问题,请尝试:
python3 -m pip3 install git+https://github.com/reach2ashish/geograpy.git
python3 geograpy-nltk