为 Haversine 距离准备数据

Question

我想为 id 的每个唯一值计算 haversine 距离：

from haversine import haversine, Unit

data = 

id latitude longitude 
a        11        22
a        33        44
b        55        66
b        77        88
c        99        11
c        12        13

start = (11,22) # (lat, lon)
end = (33,44)
haversine(start,end)*1000

如何为其创建循环？因为真实数据有2000+ ids

有很多关于 Hvaersine 的好问题，但没有关于数据准备的答案。这个问题主要是关于数据准备

Answer 1

2000 不算多，你可以用一个简单的 python 循环处理它。但如果您更喜欢 pandas-native 方法，您可以执行以下操作：

df.groupby('id').apply(lambda g: haversine(g.iloc[0], g.iloc[1])) * 1000

考虑到您的数据集始终有一对点对应每个 id。

输出：

id
a    3.320380e+06
b    2.601419e+06
c    9.673377e+06

为 Haversine 距离准备数据

Prepare data for Haversine distance

python

haversine

pandas