使用 FFTW 的零填充 FFT
zero padded FFT using FFTW
要在频域中插入信号,可以在时域中填充零并执行 FFT。
假设给定向量 X 中的元素数是 N 并且 Y 是与 X 相同,但在一侧用 N 零填充。那么下面给出相同的结果。
$$\hat{x}(k)=\sum_{n=0}^{2N-1} Y(n)e^{i2\pi k n/2N},\quad k=0,...,2N-1,$$
$$\hat{x}(k)=\sum_{n=0}^{ N-1} X(n)e^{i2\pi k n/2N},\quad k=0,...,2N-1.$$
现在如果我们使用 FFTW 包,第一个方程需要 2N 内存 space 作为输入向量,而第二个一个只需要 N 内存 space (我不知道在现有的 FFTW 包中是否可以做到)!计算复杂度也从 2N^2log(2N) 降低到 2N^2log(N)。每当我们进行 2D FFT 或 3D FFT 时,问题就会变得更糟。是否可以使用 FFTW 包进行第二种方法?不过,这在 MATLAB 中很容易做到。
如果 x
是一个 2N 信号,在 N 上方用零填充,其 DFT 写为:
- 如果
k
是偶数:
因此,偶数频率的系数来自N-point离散傅里叶变换x(n)
。
- 如果
k
是奇数:
因此,奇数频率的系数来自N-point离散傅立叶变换x(n)exp(i*M_PI*n/N)
。
因此,zero-padded 2N 信号的离散傅里叶变换恢复为长度为 N 的信号的两个 DFT,并且可以使用 fftw 来计算它们。
总计算时间为 2*c*N*ln(N)
,其中 c
是常数。预计它会比直接计算 DFT c*2*N*ln(2*N)
更快。请记住 ln(2*N)=ln(2)+ln(N)
:随着 N 变大, 与 ln(N)
相比,直接计算的额外工作可以忽略不计:技巧变得无用, 即使尺寸大于一。它不影响复杂性。
此外,FFTW 非常高效,如果安装正确,它会使用您 PC 的许多功能,并且在任何情况下都很难做得比这更好,即使提供的技巧是 最后,如果输入信号是真实的,您可以使用 fftw_plan fftw_plan_dft_r2c_2d
:傅里叶系数 space 中只有一半的系数被计算和存储。
关于内存要求,如果实在内存不足,可以使用FFTW_IN_PLACE
标志,输入输出使用同一个数组。然而,它稍微慢一点。
上面介绍的过程可以扩展到计算用 (L-1)N 个零填充的 N-point 信号的 LN 信号的 DFT:它恢复到长度为 N 的 L 个 DFT 的计算。
您是否有任何参考资料显示 MATLAB 与 FFTW 相比如何处理和优化填充信号的 DFT?
编辑:关于 3D 案例的进一步研究:
填充的 3D 信号 x(n,m,p)
的 3D DFT 是:
如果 k_n
、k_m
和 k_p
是偶数:
如果k_n
和k_m
是偶数而k_p
是奇数:
...有8个案例
因此,将大小为 NxNxN 的 3D x
的 3d dft 填充到 2Nx2Nx2N 的 3d dft 的计算恢复到大小为 NxNxN 的 8 个 3d dft 的计算。尺寸a 3d dft是3个1d dft的组合,尺寸N的dft总数为3x8xNxN,而直接计算需要尺寸为2N的3x(2N)*(2N)dft。计算时间是 24cN^3ln(N)
而不是 24cN^3ln(2N)
:小的增益是可能的...再次 fftw 很快...
然而,我们不使用 black-box 3d fft,而是通过在每个方向上执行 1d dft,一次计算大小为 N 的 8 个 dft。
- 1d 沿 N 的 dft:2 个案例,
NxN
dfts => 2cN^3ln(N)
- 1d 沿 M 的 dft:2 个案例,
2NxN
dfts => 4cN^3ln(N)
- 1d 沿 P 的 dft:2 个案例,
2Nx2N
dfts => 8cN^3ln(N)
因此,总计算时间预计为 14cN^3ln(N)
而不是 24cN^3ln(2N)
:小的增益是可能的...同样 fftw 很快...
此外,
的计算
只需要调用一次 exp
:首先计算 w=exp(I*M_PI/N)
然后更新 wn=wn*w; x(n)=x(n)*wn
或者如果精度成为问题则使用 pow
。
要在频域中插入信号,可以在时域中填充零并执行 FFT。
假设给定向量 X 中的元素数是 N 并且 Y 是与 X 相同,但在一侧用 N 零填充。那么下面给出相同的结果。
$$\hat{x}(k)=\sum_{n=0}^{2N-1} Y(n)e^{i2\pi k n/2N},\quad k=0,...,2N-1,$$
$$\hat{x}(k)=\sum_{n=0}^{ N-1} X(n)e^{i2\pi k n/2N},\quad k=0,...,2N-1.$$
现在如果我们使用 FFTW 包,第一个方程需要 2N 内存 space 作为输入向量,而第二个一个只需要 N 内存 space (我不知道在现有的 FFTW 包中是否可以做到)!计算复杂度也从 2N^2log(2N) 降低到 2N^2log(N)。每当我们进行 2D FFT 或 3D FFT 时,问题就会变得更糟。是否可以使用 FFTW 包进行第二种方法?不过,这在 MATLAB 中很容易做到。
如果 x
是一个 2N 信号,在 N 上方用零填充,其 DFT 写为:
- 如果
k
是偶数:
因此,偶数频率的系数来自N-point离散傅里叶变换x(n)
。
- 如果
k
是奇数:
因此,奇数频率的系数来自N-point离散傅立叶变换x(n)exp(i*M_PI*n/N)
。
因此,zero-padded 2N 信号的离散傅里叶变换恢复为长度为 N 的信号的两个 DFT,并且可以使用 fftw 来计算它们。
总计算时间为 2*c*N*ln(N)
,其中 c
是常数。预计它会比直接计算 DFT c*2*N*ln(2*N)
更快。请记住 ln(2*N)=ln(2)+ln(N)
:随着 N 变大, 与 ln(N)
相比,直接计算的额外工作可以忽略不计:技巧变得无用, 即使尺寸大于一。它不影响复杂性。
此外,FFTW 非常高效,如果安装正确,它会使用您 PC 的许多功能,并且在任何情况下都很难做得比这更好,即使提供的技巧是 最后,如果输入信号是真实的,您可以使用 fftw_plan fftw_plan_dft_r2c_2d
:傅里叶系数 space 中只有一半的系数被计算和存储。
关于内存要求,如果实在内存不足,可以使用FFTW_IN_PLACE
标志,输入输出使用同一个数组。然而,它稍微慢一点。
上面介绍的过程可以扩展到计算用 (L-1)N 个零填充的 N-point 信号的 LN 信号的 DFT:它恢复到长度为 N 的 L 个 DFT 的计算。
您是否有任何参考资料显示 MATLAB 与 FFTW 相比如何处理和优化填充信号的 DFT?
编辑:关于 3D 案例的进一步研究:
填充的 3D 信号 x(n,m,p)
的 3D DFT 是:
如果 k_n
、k_m
和 k_p
是偶数:
如果k_n
和k_m
是偶数而k_p
是奇数:
...有8个案例
因此,将大小为 NxNxN 的 3D x
的 3d dft 填充到 2Nx2Nx2N 的 3d dft 的计算恢复到大小为 NxNxN 的 8 个 3d dft 的计算。尺寸a 3d dft是3个1d dft的组合,尺寸N的dft总数为3x8xNxN,而直接计算需要尺寸为2N的3x(2N)*(2N)dft。计算时间是 24cN^3ln(N)
而不是 24cN^3ln(2N)
:小的增益是可能的...再次 fftw 很快...
然而,我们不使用 black-box 3d fft,而是通过在每个方向上执行 1d dft,一次计算大小为 N 的 8 个 dft。
- 1d 沿 N 的 dft:2 个案例,
NxN
dfts =>2cN^3ln(N)
- 1d 沿 M 的 dft:2 个案例,
2NxN
dfts =>4cN^3ln(N)
- 1d 沿 P 的 dft:2 个案例,
2Nx2N
dfts =>8cN^3ln(N)
因此,总计算时间预计为 14cN^3ln(N)
而不是 24cN^3ln(2N)
:小的增益是可能的...同样 fftw 很快...
此外,
的计算 只需要调用一次 exp
:首先计算 w=exp(I*M_PI/N)
然后更新 wn=wn*w; x(n)=x(n)*wn
或者如果精度成为问题则使用 pow
。