使用 FFTW 的零填充 FFT

zero padded FFT using FFTW

要在频域中插入信号,可以在时域中填充零并执行 FFT

假设给定向量 X 中的元素数是 N 并且 Y 是与 X 相同,但在一侧用 N 零填充。那么下面给出相同的结果。

$$\hat{x}(k)=\sum_{n=0}^{2N-1} Y(n)e^{i2\pi k n/2N},\quad k=0,...,2N-1,$$
$$\hat{x}(k)=\sum_{n=0}^{ N-1} X(n)e^{i2\pi k n/2N},\quad k=0,...,2N-1.$$

现在如果我们使用 FFTW 包,第一个方程需要 2N 内存 space 作为输入向量,而第二个一个只需要 N 内存 space (我不知道在现有的 FFTW 包中是否可以做到)!计算复杂度也从 2N^2log(2N) 降低到 2N^2log(N)。每当我们进行 2D FFT3D FFT 时,问题就会变得更糟。是否可以使用 FFTW 包进行第二种方法?不过,这在 MATLAB 中很容易做到。

如果 x 是一个 2N 信号,在 N 上方用零填充,其 DFT 写为:

eq

  • 如果 k 是偶数:

eq2

因此,偶数频率的系数来自N-point离散傅里叶变换x(n)

  • 如果 k 是奇数:

eq3

因此,奇数频率的系数来自N-point离散傅立叶变换x(n)exp(i*M_PI*n/N)

因此,zero-padded 2N 信号的离散傅里叶变换恢复为长度为 N 的信号的两个 DFT,并且可以使用 fftw 来计算它们。

总计算时间为 2*c*N*ln(N),其中 c 是常数。预计它会比直接计算 DFT c*2*N*ln(2*N) 更快。请记住 ln(2*N)=ln(2)+ln(N) :随着 N 变大, ln(N) 相比,直接计算的额外工作可以忽略不计:技巧变得无用, 即使尺寸大于一。它不影响复杂性。

此外,FFTW 非常高效,如果安装正确,它会使用您 PC 的许多功能,并且在任何情况下都很难做得比这更好,即使提供的技巧是 最后,如果输入信号是真实的,您可以使用 fftw_plan fftw_plan_dft_r2c_2d :傅里叶系数 space 中只有一半的系数被计算和存储。

关于内存要求,如果实在内存不足,可以使用FFTW_IN_PLACE标志,输入输出使用同一个数组。然而,它稍微慢一点。

上面介绍的过程可以扩展到计算用 (L-1)N 个零填充的 N-point 信号的 LN 信号的 DFT:它恢复到长度为 N 的 L 个 DFT 的计算。

您是否有任何参考资料显示 MATLAB 与 FFTW 相比如何处理和优化填充信号的 DFT?

编辑:关于 3D 案例的进一步研究:

填充的 3D 信号 x(n,m,p) 的 3D DFT 是:

eq4

如果 k_nk_mk_p 是偶数:

eq5

如果k_nk_m是偶数而k_p是奇数:

eq6

...有8个案例

因此,将大小为 NxNxN 的 3D x 的 3d dft 填充到 2Nx2Nx2N 的 3d dft 的计算恢复到大小为 NxNxN 的 8 个 3d dft 的计算。尺寸a 3d dft是3个1d dft的组合,尺寸N的dft总数为3x8xNxN,而直接计算需要尺寸为2N的3x(2N)*(2N)dft。计算时间是 24cN^3ln(N) 而不是 24cN^3ln(2N) :小的增益是可能的...再次 fftw 很快...

然而,我们不使用 black-box 3d fft,而是通过在每个方向上执行 1d dft,一次计算大小为 N 的 8 个 dft。

  • 1d 沿 N 的 dft:2 个案例,NxN dfts => 2cN^3ln(N)
  • 1d 沿 M 的 dft:2 个案例,2NxN dfts => 4cN^3ln(N)
  • 1d 沿 P 的 dft:2 个案例,2Nx2N dfts => 8cN^3ln(N)

因此,总计算时间预计为 14cN^3ln(N) 而不是 24cN^3ln(2N) :小的增益是可能的...同样 fftw 很快...

此外,

的计算

eq7

只需要调用一次 exp :首先计算 w=exp(I*M_PI/N) 然后更新 wn=wn*w; x(n)=x(n)*wn 或者如果精度成为问题则使用 pow