如何使用测地线创建距离 table
How to create distance table using geodesic
我正在用 Python 计算。假设我有这种 DataFrame,它由一些点组成
import pandas as pd
dfa=pd.DataFrame(([1,2],[1,3],[1,1],[1,4]), columns=['y','x'])
之前,我使用了 scipy.spatial 的距离矩阵,并使用此代码创建了另一个 DataFrame。但它似乎无法精确计算点之间的距离(长纬度)
from scipy.spatial import distance_matrix
pd.DataFrame(distance_matrix(dfa.values, dfa.values), index=dfa.index, columns=dfa.index)
您认为可以用测地线更改计算吗?这是我试过的。
from geopy.distance import geodesic
pd.DataFrame(geodesic(dfa.values[0], dfa.values[0]).kilometers, index=dfa.index, columns=dfa.index)
# i don't know how to change [0] adjusted to column and index
有什么建议吗?
给定一个列表或类似列表的对象locations
,你可以
distances = pd.DataFrame([[geodesic(a,b) for a in locations]
for b in locations])
不过,这将是多余的,因为它会计算 a,b 和 b,a 的距离,即使它们应该相同。根据 geodesic
的成本,您可能会更快地找到以下一些替代方案:
distances = pd.DataFrame([[geodesic(a,b) if a > b else 0
for a in locations]
for b in locations])
distances = distances.add(distances.T)
size = len(locations)
distances = pd.DataFrame(columns = range(size), index = range(size))
def get_distance(i,j):
if distances.loc[j,i]:
return distances.loc[j,i]
if i == j:
return 0
return geodesic(locations[i], locations[j])
for i in range(size):
for j in range(size):
distances.loc[i,j] = get_distance(i,j)
您还可以将数据存储为字典,其中的键从 itertools.combinations
输出。还有 this article 关于创建对称矩阵 class。
我正在用 Python 计算。假设我有这种 DataFrame,它由一些点组成
import pandas as pd
dfa=pd.DataFrame(([1,2],[1,3],[1,1],[1,4]), columns=['y','x'])
之前,我使用了 scipy.spatial 的距离矩阵,并使用此代码创建了另一个 DataFrame。但它似乎无法精确计算点之间的距离(长纬度)
from scipy.spatial import distance_matrix
pd.DataFrame(distance_matrix(dfa.values, dfa.values), index=dfa.index, columns=dfa.index)
您认为可以用测地线更改计算吗?这是我试过的。
from geopy.distance import geodesic
pd.DataFrame(geodesic(dfa.values[0], dfa.values[0]).kilometers, index=dfa.index, columns=dfa.index)
# i don't know how to change [0] adjusted to column and index
有什么建议吗?
给定一个列表或类似列表的对象locations
,你可以
distances = pd.DataFrame([[geodesic(a,b) for a in locations]
for b in locations])
不过,这将是多余的,因为它会计算 a,b 和 b,a 的距离,即使它们应该相同。根据 geodesic
的成本,您可能会更快地找到以下一些替代方案:
distances = pd.DataFrame([[geodesic(a,b) if a > b else 0
for a in locations]
for b in locations])
distances = distances.add(distances.T)
size = len(locations)
distances = pd.DataFrame(columns = range(size), index = range(size))
def get_distance(i,j):
if distances.loc[j,i]:
return distances.loc[j,i]
if i == j:
return 0
return geodesic(locations[i], locations[j])
for i in range(size):
for j in range(size):
distances.loc[i,j] = get_distance(i,j)
您还可以将数据存储为字典,其中的键从 itertools.combinations
输出。还有 this article 关于创建对称矩阵 class。