CImg立方亚像素位置

CImg cubic subpixel location

我想了解使用 C++ Image Processing Toolkit 的 CImg.h 文件从图像中提取值的代码在做什么。

该函数使用以下语句:

float dx(float x, float y, CImg<float> &i) {
    float val = i.cubic_atXY(x + 0.5, y);
    return val;
}

我认为它试图在坐标 (x+0.5,y) 上找到三次插值子像素。我发现这个函数是在 CImg.h 文件的第 12450 行附近定义的,但我真的不知道如何将它翻译成其他代码,例如 python.

用过这种库的人能看懂吗?

cubic_atXY是一些看起来很繁琐的代码,但基本上都是简单的算术运算,在其他编程语言中应该有类似的语法。唯一不通用的行是这样的,例如:

const Tfloat Ipp = (Tfloat)atXY(px,py,z,c,out_value)

这是 C 风格的转换。它将调用 atXY() 的结果转换为 Tfloat。顺便说一句,这看起来像双三次插值。

atXY() 调用是为了检查用于进行双三次插值的点是否在帧限制内。 正如 Carlton 所说的和我确认的功能,它是一个双三次插值,用于提取图像内任何位置的子像素的值。 我试图将代码转换为 python,最后我执行了以下代码,给出了与 CImg.h 函数相同的结果。

*考虑到我直接使用逻辑运算符实现了 atXY() 函数并且索引 (x,y) 更改为 (y,x) 因为 python 使用 (idRow, idCol) 用于矩阵索引

def bicubic(fx, fy, img):

   img = img.astype(float)
   h,w = np.shape(img)

   if(fx < 0 or fx > w-1 or fy < 0 or fy > h-1):
       val = 0
       return val

   x = int(fx)
   y = int(fy)

   dx = fx - x
   dy = fy - y

   px = 0 if x-1<0 else x-1
   py = 0 if y-1<0 else y-1

   nx = x+1 if dx>0 else x
   ny = y+1 if dy>0 else y

   ax = w-1 if x+2>=w else x+2
   ay = h-1 if y+2>=h else y+2

   Ipp = img[py,px]; Icp = img[py,x]; Inp = img[py,nx]; Iap = img[py,ax];
   Ip = Icp + 0.5*(dx*(-Ipp+Inp) + dx*dx*(2*Ipp-5*Icp+4*Inp-Iap) + dx*dx*dx*(-Ipp+3*Icp-3*Inp+Iap))
   Ipc = img[y,px]; Icc = img[y,x]; Inc = img[y,nx]; Iac = img[y,ax];
   Ic = Icc + 0.5*(dx*(-Ipc+Inc) + dx*dx*(2*Ipc-5*Icc+4*Inc-Iac) + dx*dx*dx*(-Ipc+3*Icc-3*Inc+Iac))
   Ipn = img[ny,px]; Icn = img[ny,x]; Inn = img[ny,nx]; Ian = img[ny,ax];
   In = Icn + 0.5*(dx*(-Ipn+Inn) + dx*dx*(2*Ipn-5*Icn+4*Inn-Ian) + dx*dx*dx*(-Ipn+3*Icn-3*Inn+Ian))
   Ipa = img[ay,px]; Ica = img[ay,x]; Ina = img[ay,nx]; Iaa = img[ay,ax];
   Ia = Ica + 0.5*(dx*(-Ipa+Ina) + dx*dx*(2*Ipa-5*Ica+4*Ina-Iaa) + dx*dx*dx*(-Ipa+3*Ica-3*Ina+Iaa))

   val = Ic + 0.5*(dy*(-Ip+In) + dy*dy*(2*Ip-5*Ic+4*In-Ia) + dy*dy*dy*(-Ip+3*Ic-3*In+Ia))
   return val