python 中的测地距离变换
geodesic distance transform in python
在python中,scipy.ndimage.morphology
模块中有distance_transform_edt
函数。我将它应用于一个简单的案例,以计算与屏蔽 numpy 数组中单个单元格的距离。
然而,该函数删除数组的掩码并按预期计算每个单元格的欧几里得距离,每个单元格具有非空值,与参考单元格具有空值。
下面是我在my blog post中给出的例子:
%pylab
from scipy.ndimage.morphology import distance_transform_edt
l = 100
x, y = np.indices((l, l))
center1 = (50, 20)
center2 = (28, 24)
center3 = (30, 50)
center4 = (60,48)
radius1, radius2, radius3, radius4 = 15, 12, 19, 12
circle1 = (x - center1[0])**2 + (y - center1[1])**2 < radius1**2
circle2 = (x - center2[0])**2 + (y - center2[1])**2 < radius2**2
circle3 = (x - center3[0])**2 + (y - center3[1])**2 < radius3**2
circle4 = (x - center4[0])**2 + (y - center4[1])**2 < radius4**2
# 3 circles
img = circle1 + circle2 + circle3 + circle4
mask = ~img.astype(bool)
img = img.astype(float)
m = ones_like(img)
m[center1] = 0
#imshow(distance_transform_edt(m), interpolation='nearest')
m = ma.masked_array(distance_transform_edt(m), mask)
imshow(m, interpolation='nearest')
但是我想计算考虑到数组的屏蔽元素的测地线距离变换。我不想沿着穿过屏蔽元素的直线计算欧氏距离。
我用Dijkstra算法得到了我想要的结果。下面是我提出的实现:
def geodesic_distance_transform(m):
mask = m.mask
visit_mask = mask.copy() # mask visited cells
m = m.filled(numpy.inf)
m[m!=0] = numpy.inf
distance_increments = numpy.asarray([sqrt(2), 1., sqrt(2), 1., 1., sqrt(2), 1., sqrt(2)])
connectivity = [(i,j) for i in [-1, 0, 1] for j in [-1, 0, 1] if (not (i == j == 0))]
cc = unravel_index(m.argmin(), m.shape) # current_cell
while (~visit_mask).sum() > 0:
neighbors = [tuple(e) for e in asarray(cc) - connectivity
if not visit_mask[tuple(e)]]
tentative_distance = [distance_increments[i] for i,e in enumerate(asarray(cc) - connectivity)
if not visit_mask[tuple(e)]]
for i,e in enumerate(neighbors):
d = tentative_distance[i] + m[cc]
if d < m[e]:
m[e] = d
visit_mask[cc] = True
m_mask = ma.masked_array(m, visit_mask)
cc = unravel_index(m_mask.argmin(), m.shape)
return m
gdt = geodesic_distance_transform(m)
imshow(gdt, interpolation='nearest')
colorbar()
上面实现的函数运行良好,但对于我开发的需要多次计算测地线距离变换的应用程序来说太慢了。
下面是欧氏距离变换和测地线距离变换的时间基准:
%timeit distance_transform_edt(m)
1000 loops, best of 3: 1.07 ms per loop
%timeit geodesic_distance_transform(m)
1 loops, best of 3: 702 ms per loop
如何获得更快的测地线距离变换?
首先,为一个非常清晰且写得很好的问题点赞。
有一个名为 scikit-fmm
的 Fast Marching
方法的实现非常好且快速,可以解决此类问题。您可以在此处找到详细信息:
http://pythonhosted.org//scikit-fmm/
安装它可能是最难的部分,但在 Windows 上安装 Conda 很容易,因为 Py27 有 64 位 Conda 包:
https://binstar.org/jmargeta/scikit-fmm
从那里开始,只需将掩码数组传递给它,就像您对自己的函数所做的那样。喜欢:
distance = skfmm.distance(m)
结果看起来相似,我认为甚至更好。您的方法(显然)在八个不同的方向上搜索,导致有点“octagonal-shaped”距离。
在我的机器上,scikit-fmm 实现比您的函数快 200 多倍。
64 位 Windows scikit-fmm 二进制文件现在可从 Christoph Gohlke 获得。
实现与 geodesic_distance_transform
:
相同的结果的稍微快一点(大约 10 倍)的实现
def getMissingMask(slab):
nan_mask=numpy.where(numpy.isnan(slab),1,0)
if not hasattr(slab,'mask'):
mask_mask=numpy.zeros(slab.shape)
else:
if slab.mask.size==1 and slab.mask==False:
mask_mask=numpy.zeros(slab.shape)
else:
mask_mask=numpy.where(slab.mask,1,0)
mask=numpy.where(mask_mask+nan_mask>0,1,0)
return mask
def geodesic(img,seed):
seedy,seedx=seed
mask=getMissingMask(img)
#----Call distance_transform_edt if no missing----
if mask.sum()==0:
slab=numpy.ones(img.shape)
slab[seedy,seedx]=0
return distance_transform_edt(slab)
target=(1-mask).sum()
dist=numpy.ones(img.shape)*numpy.inf
dist[seedy,seedx]=0
def expandDir(img,direction):
if direction=='n':
l1=img[0,:]
img=numpy.roll(img,1,axis=0)
img[0,:]==l1
elif direction=='s':
l1=img[-1,:]
img=numpy.roll(img,-1,axis=0)
img[-1,:]==l1
elif direction=='e':
l1=img[:,0]
img=numpy.roll(img,1,axis=1)
img[:,0]=l1
elif direction=='w':
l1=img[:,-1]
img=numpy.roll(img,-1,axis=1)
img[:,-1]==l1
elif direction=='ne':
img=expandDir(img,'n')
img=expandDir(img,'e')
elif direction=='nw':
img=expandDir(img,'n')
img=expandDir(img,'w')
elif direction=='sw':
img=expandDir(img,'s')
img=expandDir(img,'w')
elif direction=='se':
img=expandDir(img,'s')
img=expandDir(img,'e')
return img
def expandIter(img):
sqrt2=numpy.sqrt(2)
tmps=[]
for dirii,dd in zip(['n','s','e','w','ne','nw','sw','se'],\
[1,]*4+[sqrt2,]*4):
tmpii=expandDir(img,dirii)+dd
tmpii=numpy.minimum(tmpii,img)
tmps.append(tmpii)
img=reduce(lambda x,y:numpy.minimum(x,y),tmps)
return img
#----------------Iteratively expand----------------
dist_old=dist
while True:
expand=expandIter(dist)
dist=numpy.where(mask,dist,expand)
nc=dist.size-len(numpy.where(dist==numpy.inf)[0])
if nc>=target or numpy.all(dist_old==dist):
break
dist_old=dist
return dist
另请注意,如果掩码形成超过 1 个连接区域(例如,添加另一个不接触其他圆圈),您的函数将陷入无限循环。
更新:
我找到了一个快速扫描方法 in this notebook 的 Cython 实现,它可以用来实现与 scikit-fmm
相同的结果,而且速度可能相当。只需要提供一个二进制标志矩阵(1s 作为可行点,否则 inf
)作为 GDT()
函数的成本。
在python中,scipy.ndimage.morphology
模块中有distance_transform_edt
函数。我将它应用于一个简单的案例,以计算与屏蔽 numpy 数组中单个单元格的距离。
然而,该函数删除数组的掩码并按预期计算每个单元格的欧几里得距离,每个单元格具有非空值,与参考单元格具有空值。
下面是我在my blog post中给出的例子:
%pylab
from scipy.ndimage.morphology import distance_transform_edt
l = 100
x, y = np.indices((l, l))
center1 = (50, 20)
center2 = (28, 24)
center3 = (30, 50)
center4 = (60,48)
radius1, radius2, radius3, radius4 = 15, 12, 19, 12
circle1 = (x - center1[0])**2 + (y - center1[1])**2 < radius1**2
circle2 = (x - center2[0])**2 + (y - center2[1])**2 < radius2**2
circle3 = (x - center3[0])**2 + (y - center3[1])**2 < radius3**2
circle4 = (x - center4[0])**2 + (y - center4[1])**2 < radius4**2
# 3 circles
img = circle1 + circle2 + circle3 + circle4
mask = ~img.astype(bool)
img = img.astype(float)
m = ones_like(img)
m[center1] = 0
#imshow(distance_transform_edt(m), interpolation='nearest')
m = ma.masked_array(distance_transform_edt(m), mask)
imshow(m, interpolation='nearest')
但是我想计算考虑到数组的屏蔽元素的测地线距离变换。我不想沿着穿过屏蔽元素的直线计算欧氏距离。
我用Dijkstra算法得到了我想要的结果。下面是我提出的实现:
def geodesic_distance_transform(m):
mask = m.mask
visit_mask = mask.copy() # mask visited cells
m = m.filled(numpy.inf)
m[m!=0] = numpy.inf
distance_increments = numpy.asarray([sqrt(2), 1., sqrt(2), 1., 1., sqrt(2), 1., sqrt(2)])
connectivity = [(i,j) for i in [-1, 0, 1] for j in [-1, 0, 1] if (not (i == j == 0))]
cc = unravel_index(m.argmin(), m.shape) # current_cell
while (~visit_mask).sum() > 0:
neighbors = [tuple(e) for e in asarray(cc) - connectivity
if not visit_mask[tuple(e)]]
tentative_distance = [distance_increments[i] for i,e in enumerate(asarray(cc) - connectivity)
if not visit_mask[tuple(e)]]
for i,e in enumerate(neighbors):
d = tentative_distance[i] + m[cc]
if d < m[e]:
m[e] = d
visit_mask[cc] = True
m_mask = ma.masked_array(m, visit_mask)
cc = unravel_index(m_mask.argmin(), m.shape)
return m
gdt = geodesic_distance_transform(m)
imshow(gdt, interpolation='nearest')
colorbar()
上面实现的函数运行良好,但对于我开发的需要多次计算测地线距离变换的应用程序来说太慢了。
下面是欧氏距离变换和测地线距离变换的时间基准:
%timeit distance_transform_edt(m)
1000 loops, best of 3: 1.07 ms per loop
%timeit geodesic_distance_transform(m)
1 loops, best of 3: 702 ms per loop
如何获得更快的测地线距离变换?
首先,为一个非常清晰且写得很好的问题点赞。
有一个名为 scikit-fmm
的 Fast Marching
方法的实现非常好且快速,可以解决此类问题。您可以在此处找到详细信息:
http://pythonhosted.org//scikit-fmm/
安装它可能是最难的部分,但在 Windows 上安装 Conda 很容易,因为 Py27 有 64 位 Conda 包: https://binstar.org/jmargeta/scikit-fmm
从那里开始,只需将掩码数组传递给它,就像您对自己的函数所做的那样。喜欢:
distance = skfmm.distance(m)
结果看起来相似,我认为甚至更好。您的方法(显然)在八个不同的方向上搜索,导致有点“octagonal-shaped”距离。
在我的机器上,scikit-fmm 实现比您的函数快 200 多倍。
64 位 Windows scikit-fmm 二进制文件现在可从 Christoph Gohlke 获得。
实现与 geodesic_distance_transform
:
def getMissingMask(slab):
nan_mask=numpy.where(numpy.isnan(slab),1,0)
if not hasattr(slab,'mask'):
mask_mask=numpy.zeros(slab.shape)
else:
if slab.mask.size==1 and slab.mask==False:
mask_mask=numpy.zeros(slab.shape)
else:
mask_mask=numpy.where(slab.mask,1,0)
mask=numpy.where(mask_mask+nan_mask>0,1,0)
return mask
def geodesic(img,seed):
seedy,seedx=seed
mask=getMissingMask(img)
#----Call distance_transform_edt if no missing----
if mask.sum()==0:
slab=numpy.ones(img.shape)
slab[seedy,seedx]=0
return distance_transform_edt(slab)
target=(1-mask).sum()
dist=numpy.ones(img.shape)*numpy.inf
dist[seedy,seedx]=0
def expandDir(img,direction):
if direction=='n':
l1=img[0,:]
img=numpy.roll(img,1,axis=0)
img[0,:]==l1
elif direction=='s':
l1=img[-1,:]
img=numpy.roll(img,-1,axis=0)
img[-1,:]==l1
elif direction=='e':
l1=img[:,0]
img=numpy.roll(img,1,axis=1)
img[:,0]=l1
elif direction=='w':
l1=img[:,-1]
img=numpy.roll(img,-1,axis=1)
img[:,-1]==l1
elif direction=='ne':
img=expandDir(img,'n')
img=expandDir(img,'e')
elif direction=='nw':
img=expandDir(img,'n')
img=expandDir(img,'w')
elif direction=='sw':
img=expandDir(img,'s')
img=expandDir(img,'w')
elif direction=='se':
img=expandDir(img,'s')
img=expandDir(img,'e')
return img
def expandIter(img):
sqrt2=numpy.sqrt(2)
tmps=[]
for dirii,dd in zip(['n','s','e','w','ne','nw','sw','se'],\
[1,]*4+[sqrt2,]*4):
tmpii=expandDir(img,dirii)+dd
tmpii=numpy.minimum(tmpii,img)
tmps.append(tmpii)
img=reduce(lambda x,y:numpy.minimum(x,y),tmps)
return img
#----------------Iteratively expand----------------
dist_old=dist
while True:
expand=expandIter(dist)
dist=numpy.where(mask,dist,expand)
nc=dist.size-len(numpy.where(dist==numpy.inf)[0])
if nc>=target or numpy.all(dist_old==dist):
break
dist_old=dist
return dist
另请注意,如果掩码形成超过 1 个连接区域(例如,添加另一个不接触其他圆圈),您的函数将陷入无限循环。
更新:
我找到了一个快速扫描方法 in this notebook 的 Cython 实现,它可以用来实现与 scikit-fmm
相同的结果,而且速度可能相当。只需要提供一个二进制标志矩阵(1s 作为可行点,否则 inf
)作为 GDT()
函数的成本。