具有模式功能的块减少(下采样)3D阵列

Block reduce (downsample) 3D array with mode function

我想通过获取原始值的最频繁值(模式)来对 3d 数组进行下采样。经过一番研究,我在 skimage 库中找到了 block_reduce 函数。例如,如果我想取块的平均值,我可以很容易地做到:

from skimage.measure import block_reduce
image = np.arange(4*4*4).reshape(4, 4, 4)
new_image = block_reduce(image, block_size=(2,2,2), func=np.mean, cval=np.mean(grades))

在我的例子中,我想将模式函数传递给 func 参数。但是,numpy 没有模式功能。根据文档,传递的函数应该接受 'axis' 作为参数。我尝试了一些解决方法,例如编写自己的函数并组合 np.uniquenp.argmax,以及将 scipy.stats.mode 作为函数传递。都失败了。

我写了一些嵌套的 for 循环来执行此操作,但它对于大型数组来说太慢了。是否有捷径可寻?我不一定需要使用sci-kit图像库。

提前致谢。

让我们假设输入图像形状可以被 block_size 整除,即相应的形状尺寸可以被 block_size 的每个尺寸参数整除。

因此,作为预处理,我们需要从输入 image 中提取块,就像这样 -

def blockify(image, block_size):
    shp = image.shape
    out_shp = [s//b for s,b in zip(shp, block_size)]
    reshape_shp = np.c_[out_shp,block_size].ravel()
    nC = np.prod(block_size)
    return image.reshape(reshape_shp).transpose(0,2,4,1,3,5).reshape(-1,nC)

接下来,对于 mode 查找的具体情况,我们将使用 argmax -

#  @Divakar
def bincount2D_vectorized(a):    
    N = a.max()+1
    a_offs = a + np.arange(a.shape[0])[:,None]*N
    return np.bincount(a_offs.ravel(), minlength=a.shape[0]*N).reshape(-1,N)

out = bincount2D_vectorized(blockify(image, block_size=(2,2,2))).argmax(1)

或者,我们可以使用 n-dim mode -

out = mode(blockify(image, block_size=(2,2,2)), axis=1)[0]

最后,如果可除性的初始假设不成立,我们需要用适当的填充值填充。同样,我们可以使用 np.pad 作为 blockify 方法的一部分。