用于根据提交的字符串推断 country/location 的库或 API?

Library or API for inferring country/location based on submitted string?

我正在追溯清理 Offer Drive 产品 (http://offerletter.io/drive.html) 的大量数据。我正在尝试规范化自由格式 "location" 字段以确定提交的位置是否位于美国。

值的粒度可能不同,但都是 "real",例如

San Francisco, CA Milwaukee Bangalore 我的问题是,是否有一种好方法(某些 API 或库)可以根据用户提交的字符串智能地规范化这些字符串,这样我可以说:

normalized = GeoNormalize.normalize("San Francisco")
return normalized.country() == "United States"

我真的很喜欢 chronyk ( https://github.com/KoffeinFlummi/Chronyk ),而且对于位置来说类似的东西会很棒。

有很多,通常由制图或 GIS 供应商提供。

例如,Google 地理编码服务接受一个字符串和 returns 一组标准格式的排名位置:

https://developers.google.com/maps/documentation/geocoding/?csw=1#Geocoding

雅虎也有一个:

https://developer.yahoo.com/boss/geo/#overview

就像我说的,有很多很多。它们通常在轻度使用时免费,但在一定时间后会产生使用费。

尝试geograpy

如果您使用 python 3.x 并在安装过程中遇到问题,请尝试:

    python3 -m pip3 install git+https://github.com/reach2ashish/geograpy.git
    python3 geograpy-nltk