Python加速奇异值分解

Python accelerate singular value decomposition

我想计算 3D 矩阵的每个切片的奇异值分解。

我使用 numpy 和 scipy 来计算 SVD,但它们都比 MATLAB 实现慢得多。 numpy 和 scipy 版本大约需要 7 秒,而 MATLAB 版本只需要 0.7 秒。

有没有办法在 Python 中加速 SVD 计算?

Python

import time
import scipy.linalg
import numpy.linalg

A = np.random.rand(100, 100, 1000) + 1j * np.random.rand(100, 100, 1000)
S = np.empty((A.shape[2], min(A.shape[0:1])))

t1 = time.time()
for i in range(A.shape[2]):
    S[i, :] = numpy.linalg.svd(A[:, :, i], compute_uv=False)
print("[numpy] Elapsed time: {:.3f} s".format(time.time() - t1))

t1 = time.time()
for i in range(A.shape[2]):
    S[i, :] = scipy.linalg.svdvals(A[:, :, i])
print("[scipy] Elapsed time: {:.3f} s".format(time.time() - t1))

# [numpy] Elapsed time: 7.137 s
# [scipy] Elapsed time: 7.435 s

MATLAB

A = randn(100, 100, 1000) + 1j * randn(100, 100, 1000);
S = nan(size(A,3), min(size(A, [1 2])));
tic;
for i = 1:size(A, 3)
    S(i, :) = svd(A(:,:,i));
end
toc;
% Elapsed time is 0.702556 seconds.

这是np.show_config()的输出:

blas_mkl_info:
  NOT AVAILABLE
blis_info:
  NOT AVAILABLE
openblas_info:
    library_dirs = ['D:\a\1\s\numpy\build\openblas_info']
    libraries = ['openblas_info']
    language = f77
    define_macros = [('HAVE_CBLAS', None)]
blas_opt_info:
    library_dirs = ['D:\a\1\s\numpy\build\openblas_info']
    libraries = ['openblas_info']
    language = f77
    define_macros = [('HAVE_CBLAS', None)]
lapack_mkl_info:
  NOT AVAILABLE
openblas_lapack_info:
    library_dirs = ['D:\a\1\s\numpy\build\openblas_lapack_info']
    libraries = ['openblas_lapack_info']
    language = f77
    define_macros = [('HAVE_CBLAS', None)]
lapack_opt_info:
    library_dirs = ['D:\a\1\s\numpy\build\openblas_lapack_info']
    libraries = ['openblas_lapack_info']
    language = f77
    define_macros = [('HAVE_CBLAS', None)]
Supported SIMD extensions in this NumPy install:
    baseline = SSE,SSE2,SSE3
    found = SSSE3,SSE41,POPCNT,SSE42,AVX,F16C,FMA3,AVX2,AVX512F,AVX512CD,AVX512_SKX
    not found = AVX512_CLX,AVX512_CNL
None

我不确定这是否能解决您的问题,但您不需要循环任何内容,因为 np.linalg.svd() already handles n-dimensional arrays。 (即使没有,您基本上也不需要 NumPy 中的循环。)

这就是我做你正在做的事情的方式:

import time
import numpy as np
import numpy.linalg as la

shape = (100, 100, 1000)
rng = np.random.default_rng(42)
A = rng.random(shape) + 1j * rng.random(shape)

t1 = time.perf_counter()
S = la.svd(A.T, compute_uv=False)
t2 = time.perf_counter()

print(f"[numpy] Elapsed time: {t2 - t1:.3f} s")

在我的电脑上这需要 0.83 秒(使用英特尔 MKL)。不过我没有尝试你的 MATLAB 代码,所以我不确定这是否会加快你的速度。

对于支持英特尔数学核心函数库 (MKL) 的计算机,通过安装使用 MKL 的 NumPy/SciPy 版本可以显着缩短计算时间。感谢@joni 和@kwinkunks 提供的信息

在我的案例中,计算时间从使用 OpenBLAS 的 7 秒减少到使用英特尔 MKL 的 0.68 秒

这可以通过构建 NumPy 或 SciPy 根据以下教程通过源代码来完成:Build NumPy/SciPy from Source

或者,安装带有预构建 MKL 支持的 NumPy 和 SciPy 版本的 Anaconda 平台可以简化这一过程。