在 numpy 数组中查找局部最大值
Find local maximums in numpy array
我想在我拥有的一些高斯平滑数据中找到峰值。我已经研究了一些可用的峰值检测方法,但它们需要一个输入范围来进行搜索,我希望它比那更自动化。这些方法也是为非平滑数据设计的。由于我的数据已经平滑,我需要一种更简单的方法来检索峰值。我的原始数据和平滑数据如下图所示。
本质上,是否有一种 pythonic 方法从平滑数据数组中检索最大值,这样的数组如
a = [1,2,3,4,5,4,3,2,1,2,3,2,1,2,3,4,5,6,5,4,3,2,1]
会 return:
r = [5,3,6]
如果你可以排除数组边缘的最大值,你总是可以通过检查来检查一个元素是否大于它的每个邻居:
import numpy as np
array = np.array([1,2,3,4,5,4,3,2,1,2,3,2,1,2,3,4,5,6,5,4,3,2,1])
# Check that it is bigger than either of it's neighbors exluding edges:
max = (array[1:-1] > array[:-2]) & (array[1:-1] > array[2:])
# Print these values
print(array[1:-1][max])
# Locations of the maxima
print(np.arange(1, array.size-1)[max])
如果您的原始数据嘈杂,则最好使用统计方法,因为并非所有峰值都会很重要。对于您的 a
数组,一个可能的解决方案是使用双微分:
peaks = a[1:-1][np.diff(np.diff(a)) < 0]
# peaks = array([5, 3, 6])
存在完成此任务的内置函数 argrelextrema
:
import numpy as np
from scipy.signal import argrelextrema
a = np.array([1,2,3,4,5,4,3,2,1,2,3,2,1,2,3,4,5,6,5,4,3,2,1])
# determine the indices of the local maxima
max_ind = argrelextrema(a, np.greater)
# get the actual values using these indices
r = a[max_ind] # array([5, 3, 6])
这为您提供了 r
所需的输出。
从 SciPy 版本 1.1 开始,您还可以使用 find_peaks。以下是从文档本身中摘录的两个示例。
使用 height
参数,可以 select 所有高于某个阈值的最大值(在这个例子中,所有非负最大值;如果必须处理一个嘈杂的基线;如果你想找到最小值,只需将你的输入乘以 -1
):
import matplotlib.pyplot as plt
from scipy.misc import electrocardiogram
from scipy.signal import find_peaks
import numpy as np
x = electrocardiogram()[2000:4000]
peaks, _ = find_peaks(x, height=0)
plt.plot(x)
plt.plot(peaks, x[peaks], "x")
plt.plot(np.zeros_like(x), "--", color="gray")
plt.show()
另一个非常有用的参数是distance
,它定义了两个峰之间的最小距离:
peaks, _ = find_peaks(x, distance=150)
# difference between peaks is >= 150
print(np.diff(peaks))
# prints [186 180 177 171 177 169 167 164 158 162 172]
plt.plot(x)
plt.plot(peaks, x[peaks], "x")
plt.show()
>> import numpy as np
>> from scipy.signal import argrelextrema
>> a = np.array([1,2,3,4,5,4,3,2,1,2,3,2,1,2,3,4,5,6,5,4,3,2,1])
>> argrelextrema(a, np.greater)
array([ 4, 10, 17]),)
>> a[argrelextrema(a, np.greater)]
array([5, 3, 6])
如果您的输入代表噪声分布,您可以尝试 smoothing 它与 NumPy 卷积函数。
我想在我拥有的一些高斯平滑数据中找到峰值。我已经研究了一些可用的峰值检测方法,但它们需要一个输入范围来进行搜索,我希望它比那更自动化。这些方法也是为非平滑数据设计的。由于我的数据已经平滑,我需要一种更简单的方法来检索峰值。我的原始数据和平滑数据如下图所示。
本质上,是否有一种 pythonic 方法从平滑数据数组中检索最大值,这样的数组如
a = [1,2,3,4,5,4,3,2,1,2,3,2,1,2,3,4,5,6,5,4,3,2,1]
会 return:
r = [5,3,6]
如果你可以排除数组边缘的最大值,你总是可以通过检查来检查一个元素是否大于它的每个邻居:
import numpy as np
array = np.array([1,2,3,4,5,4,3,2,1,2,3,2,1,2,3,4,5,6,5,4,3,2,1])
# Check that it is bigger than either of it's neighbors exluding edges:
max = (array[1:-1] > array[:-2]) & (array[1:-1] > array[2:])
# Print these values
print(array[1:-1][max])
# Locations of the maxima
print(np.arange(1, array.size-1)[max])
如果您的原始数据嘈杂,则最好使用统计方法,因为并非所有峰值都会很重要。对于您的 a
数组,一个可能的解决方案是使用双微分:
peaks = a[1:-1][np.diff(np.diff(a)) < 0]
# peaks = array([5, 3, 6])
存在完成此任务的内置函数 argrelextrema
:
import numpy as np
from scipy.signal import argrelextrema
a = np.array([1,2,3,4,5,4,3,2,1,2,3,2,1,2,3,4,5,6,5,4,3,2,1])
# determine the indices of the local maxima
max_ind = argrelextrema(a, np.greater)
# get the actual values using these indices
r = a[max_ind] # array([5, 3, 6])
这为您提供了 r
所需的输出。
从 SciPy 版本 1.1 开始,您还可以使用 find_peaks。以下是从文档本身中摘录的两个示例。
使用 height
参数,可以 select 所有高于某个阈值的最大值(在这个例子中,所有非负最大值;如果必须处理一个嘈杂的基线;如果你想找到最小值,只需将你的输入乘以 -1
):
import matplotlib.pyplot as plt
from scipy.misc import electrocardiogram
from scipy.signal import find_peaks
import numpy as np
x = electrocardiogram()[2000:4000]
peaks, _ = find_peaks(x, height=0)
plt.plot(x)
plt.plot(peaks, x[peaks], "x")
plt.plot(np.zeros_like(x), "--", color="gray")
plt.show()
另一个非常有用的参数是distance
,它定义了两个峰之间的最小距离:
peaks, _ = find_peaks(x, distance=150)
# difference between peaks is >= 150
print(np.diff(peaks))
# prints [186 180 177 171 177 169 167 164 158 162 172]
plt.plot(x)
plt.plot(peaks, x[peaks], "x")
plt.show()
>> import numpy as np
>> from scipy.signal import argrelextrema
>> a = np.array([1,2,3,4,5,4,3,2,1,2,3,2,1,2,3,4,5,6,5,4,3,2,1])
>> argrelextrema(a, np.greater)
array([ 4, 10, 17]),)
>> a[argrelextrema(a, np.greater)]
array([5, 3, 6])
如果您的输入代表噪声分布,您可以尝试 smoothing 它与 NumPy 卷积函数。