使用 Hive 列出半径内的所有点

List all points within radius using Hive

我有一个table如下:

id_center|latitude_of_center|longitude_of_center|id_point|latitude_of_point|longitude_of_point

table 有数百万行

我正在尝试获取显示每个 id_center 的输出,其中 id_points 在 5 英里半径内,以及距离有多远,按降序排序。每行都已填满,因此每个 id_center 在单独的行中都有所有可能的 id_point。到目前为止,这是我尝试过的方法,但我得到的结果是空的:

hive> add jar /home/me/gis-tools-for-hadoop/samples/lib/esri-geometry-api.jar;
Added [/home/me/gis-tools-for-hadoop/samples/lib/esri-geometry-api.jar] to class path
Added resources: [/home/me/gis-tools-for-hadoop/samples/lib/esri-geometry-api.jar]
hive> add jar /home/me/gis-tools-for-hadoop/samples/lib/spatial-sdk-hadoop.jar;
Added [/home/me/gis-tools-for-hadoop/samples/lib/spatial-sdk-hadoop.jar] to class path
Added resources: [/home/me/gis-tools-for-hadoop/samples/lib/spatial-sdk-hadoop.jar]
hive> create temporary function ST_GeodesicLengthWGS84 AS 'com.esri.hadoop.hive.ST_GeodesicLengthWGS84';
OK
Time taken: 0.014 seconds
hive> create temporary function ST_SetSRID AS 'com.esri.hadoop.hive.ST_SetSRID';
OK
Time taken: 0.008 seconds
hive> create temporary function ST_LineString AS 'com.esri.hadoop.hive.ST_LineString';

SELECT * FROM mytable WHERE ST_GeodesicLengthWGS84(ST_SetSRID(ST_LineString(latitude_of_center, longitude_of_center, latitude_of_point, longitude_of_point), 4326)) <= 8046.72

对于ST_LineString,您首先需要经度,然后是纬度 - (X,Y) 顺序。 (同样在 GIS-SE https://gis.stackexchange.com/questions/178950/hive-gis-st-geodesiclengthwgs84-not-returning-expected-distance 上讨论过)

我在处理类似任务时在 ST_LineString 中使用了 ST_Point。在 docs 中选中此选项。 在你的情况下:

SELECT * FROM mytable
WHERE ST_GeodesicLengthWGS84(ST_SetSRID(ST_LineString(array(ST_Point(longitude_of_center, latitude_of_center), ST_Point(longitude_of_point, latitude_of_point))), 4326)) <= 8046.72;