计算 GeoPandas 中两个 GeoDataFrame(点)之间的所有距离
Calculate all distances between two GeoDataFrame (of points) in GeoPandas
这是一个非常简单的案例,但到目前为止我还没有找到任何简单的方法。这个想法是在 GeoDataFrame
中定义的所有点与另一个 GeoDataFrame
中定义的点之间获得一组距离。
import geopandas as gpd
import pandas as pd
# random coordinates
gdf_1 = gpd.GeoDataFrame(geometry=gpd.points_from_xy([0, 0, 0], [0, 90, 120]))
gdf_2 = gpd.GeoDataFrame(geometry=gpd.points_from_xy([0, 0], [0, -90]))
print(gdf_1)
print(gdf_2)
# distances are calculated elementwise
print(gdf_1.distance(gdf_2))
这会产生 gdf_1
和 gdf_2
中共享相同索引的点之间的逐元素距离(还有一个警告,因为两个 GeoSeries 没有相同的索引,这将是我的情况)。
geometry
0 POINT (0.000 0.000)
1 POINT (0.000 90.000)
2 POINT (0.000 120.000)
geometry
0 POINT (0.00000 0.00000)
1 POINT (0.00000 -90.00000)
/home/seydoux/anaconda3/envs/chelyabinsk/lib/python3.8/site-packages/geopandas/base.py:39: UserWarning: The indices of the two GeoSeries are different.
warn("The indices of the two GeoSeries are different.")
0 0.0
1 180.0
2 NaN
问题是;如何获得一系列所有点到点的距离(或者至少是 gdf_1
和 gdf_2
的索引的唯一组合,因为它是对称的)。
编辑
在this post中给出了几个点的解决方案;但我找不到一种直接的方法来组合两个数据集中的所有点。
在this post中只提出了逐元素操作。
也有人提出了类似的问题on the GitHub repo of geopandas。建议的解决方案之一是使用 apply
方法,没有任何详细答案。
您必须应用第一个 gdf 中的每个几何体才能获得第二个 gdf 中所有几何体的距离。
import geopandas as gpd
import pandas as pd
# random coordinates
gdf_1 = gpd.GeoDataFrame(geometry=gpd.points_from_xy([0, 0, 0], [0, 90, 120]))
gdf_2 = gpd.GeoDataFrame(geometry=gpd.points_from_xy([0, 0], [0, -90]))
gdf_1.geometry.apply(lambda g: gdf_2.distance(g))
0 1
0 0.0 90.0
1 90.0 180.0
2 120.0 210.0
这是一个非常简单的案例,但到目前为止我还没有找到任何简单的方法。这个想法是在 GeoDataFrame
中定义的所有点与另一个 GeoDataFrame
中定义的点之间获得一组距离。
import geopandas as gpd
import pandas as pd
# random coordinates
gdf_1 = gpd.GeoDataFrame(geometry=gpd.points_from_xy([0, 0, 0], [0, 90, 120]))
gdf_2 = gpd.GeoDataFrame(geometry=gpd.points_from_xy([0, 0], [0, -90]))
print(gdf_1)
print(gdf_2)
# distances are calculated elementwise
print(gdf_1.distance(gdf_2))
这会产生 gdf_1
和 gdf_2
中共享相同索引的点之间的逐元素距离(还有一个警告,因为两个 GeoSeries 没有相同的索引,这将是我的情况)。
geometry
0 POINT (0.000 0.000)
1 POINT (0.000 90.000)
2 POINT (0.000 120.000)
geometry
0 POINT (0.00000 0.00000)
1 POINT (0.00000 -90.00000)
/home/seydoux/anaconda3/envs/chelyabinsk/lib/python3.8/site-packages/geopandas/base.py:39: UserWarning: The indices of the two GeoSeries are different.
warn("The indices of the two GeoSeries are different.")
0 0.0
1 180.0
2 NaN
问题是;如何获得一系列所有点到点的距离(或者至少是 gdf_1
和 gdf_2
的索引的唯一组合,因为它是对称的)。
编辑
在this post中给出了几个点的解决方案;但我找不到一种直接的方法来组合两个数据集中的所有点。
在this post中只提出了逐元素操作。
也有人提出了类似的问题on the GitHub repo of geopandas。建议的解决方案之一是使用
apply
方法,没有任何详细答案。
您必须应用第一个 gdf 中的每个几何体才能获得第二个 gdf 中所有几何体的距离。
import geopandas as gpd
import pandas as pd
# random coordinates
gdf_1 = gpd.GeoDataFrame(geometry=gpd.points_from_xy([0, 0, 0], [0, 90, 120]))
gdf_2 = gpd.GeoDataFrame(geometry=gpd.points_from_xy([0, 0], [0, -90]))
gdf_1.geometry.apply(lambda g: gdf_2.distance(g))
0 1
0 0.0 90.0
1 90.0 180.0
2 120.0 210.0