属于线列表的连续点(x,y 元组)之间的迭代欧氏距离计算
Iterative euclidean distance calculation between consecutive points (x,y tuples) which belongs to a list of lines
我有一个包含线、PointID、X 和 Y 坐标的数据框;每行包含一组具有 X,Y 坐标的点:
LINE Point ID X coordinate Y Coordinate
A 1 1 2
A 2 2 2
A 3 3 2
B 1 11 3
B 2 12 3
B 3 13 3
尝试计算一条直线内连续点之间的欧几里德距离以获得以下结果:
LINE Point ID X coordinate Y Coordinate Euclidean Dist.
A 1 1 2
A 2 2 2 1 (dist between Point ID's 1 and 2 for line A)
A 3 3 2 1 (dist between Point ID's 2 and 3 for line A)
B 1 11 3
B 2 12 3 1 (dist between Point ID's 1 and 2 for line B)
B 3 13 3 1 (dist between Point ID's 2 and 3 for line B)
我的尝试是创建一个 DataFrame,使用 groupby 对行进行分组 'LINE'
然后使用 scipy:
计算一条直线内连续点之间的欧氏距离
predist = df.groupby(['LINE']).apply(lambda x: x)
dist = pdist(predist[['X', 'Y']], 'euclidean')
我肯定做错了什么,因为我得到的结果是直线的第一个点与直线内每个连续点之间的累积距离,而不是接收连续创建的每个单独线段之间的距离点(坐标元组)。
您可以使用 shift()
找到 LINE
中每个点的前一个点的 X
和 Y
坐标。然后计算这一点与上一点的距离:
import pandas as pd
import numpy as np
data = """
LINE PointID X Y
A 1 1 2
A 2 2 2
A 3 3 2
B 1 11 3
B 2 12 3
B 3 13 3"""
df = pd.read_csv(StringIO(data),sep="\s+")
dx = (df['X'] - df.groupby('LINE')['X'].shift())
dy = (df['Y'] - df.groupby('LINE')['Y'].shift())
df['dist'] = np.sqrt(dx**2 + dy**2)
这会产生预期的距离:
LINE PointID X Y dist
0 A 1 1 2 NaN
1 A 2 2 2 1.0
2 A 3 3 2 1.0
3 B 1 11 3 NaN
4 B 2 12 3 1.0
5 B 3 13 3 1.0
NaN
值可以以适合您的用例的方式填充。
我有一个包含线、PointID、X 和 Y 坐标的数据框;每行包含一组具有 X,Y 坐标的点:
LINE Point ID X coordinate Y Coordinate
A 1 1 2
A 2 2 2
A 3 3 2
B 1 11 3
B 2 12 3
B 3 13 3
尝试计算一条直线内连续点之间的欧几里德距离以获得以下结果:
LINE Point ID X coordinate Y Coordinate Euclidean Dist.
A 1 1 2
A 2 2 2 1 (dist between Point ID's 1 and 2 for line A)
A 3 3 2 1 (dist between Point ID's 2 and 3 for line A)
B 1 11 3
B 2 12 3 1 (dist between Point ID's 1 and 2 for line B)
B 3 13 3 1 (dist between Point ID's 2 and 3 for line B)
我的尝试是创建一个 DataFrame,使用 groupby 对行进行分组 'LINE' 然后使用 scipy:
计算一条直线内连续点之间的欧氏距离predist = df.groupby(['LINE']).apply(lambda x: x)
dist = pdist(predist[['X', 'Y']], 'euclidean')
我肯定做错了什么,因为我得到的结果是直线的第一个点与直线内每个连续点之间的累积距离,而不是接收连续创建的每个单独线段之间的距离点(坐标元组)。
您可以使用 shift()
找到 LINE
中每个点的前一个点的 X
和 Y
坐标。然后计算这一点与上一点的距离:
import pandas as pd
import numpy as np
data = """
LINE PointID X Y
A 1 1 2
A 2 2 2
A 3 3 2
B 1 11 3
B 2 12 3
B 3 13 3"""
df = pd.read_csv(StringIO(data),sep="\s+")
dx = (df['X'] - df.groupby('LINE')['X'].shift())
dy = (df['Y'] - df.groupby('LINE')['Y'].shift())
df['dist'] = np.sqrt(dx**2 + dy**2)
这会产生预期的距离:
LINE PointID X Y dist
0 A 1 1 2 NaN
1 A 2 2 2 1.0
2 A 3 3 2 1.0
3 B 1 11 3 NaN
4 B 2 12 3 1.0
5 B 3 13 3 1.0
NaN
值可以以适合您的用例的方式填充。