pandas 找到两个滚动最大高点并计算斜率
pandas find two rolling max highs and calculate slope
我正在寻找一种方法来找到滚动框架中的两个最大高点并计算斜率以推断可能的第三个高点。
我有几个问题:)
a) 如何寻找次高?
b) 如何知道两个高点的位置(对于简单的斜率:slope = (MaxHigh2-MaxHigh1)/(PosMaxHigh2-PosMaxHigh1))?
我当然可以做这样的事情。但我只有在 high1 > high2 时才工作:)
而且我不会有相同范围的高点。
import quandl
import pandas as pd
import numpy as np
import sys
df = quandl.get("WIKI/GOOGL")
df = df.ix[:10, ['High', 'Close' ]]
df['MAX_HIGH_3P'] = df['High'].rolling(window=3,center=False).max()
df['MAX_HIGH_5P'] = df['High'].rolling(window=5,center=False).max()
df['SLOPE'] = (df['MAX_HIGH_5P']-df['MAX_HIGH_3P'])/(5-3)
print(df.head(20).to_string())
抱歉,解决方案有点乱,但希望对您有所帮助:
首先我定义了一个函数,它将 numpy 数组作为输入,检查是否至少有 2 个元素不为空,然后计算斜率(根据您的公式 - 我认为),如下所示:
def calc_slope(input_list):
if sum(~np.isnan(x) for x in input_list) < 2:
return np.NaN
temp_list = input_list[:]
max_value = np.nanmax(temp_list)
max_index = np.where(input_list == max_value)[0][0]
temp_list = np.delete(temp_list, max_index)
second_max = np.nanmax(temp_list)
second_max_index = np.where(input_list == second_max)[0][0]
return (max_value - second_max)/(1.0*max_index-second_max_index)
在变量 df 中我有这个:
你只需要将滚动 window 应用于你喜欢的任何东西,例如应用于 "High":
df['High'].rolling(window=5, min_periods=2, center=False).apply(lambda x: calc_slope(x))
最终结果如下所示:
如果您愿意,也可以将其存储在其他列中:
df['High_slope'] = df['High'].rolling(window=5, min_periods=2, center=False).apply(lambda x: calc_slope(x))
这是你想要的吗?
我正在寻找一种方法来找到滚动框架中的两个最大高点并计算斜率以推断可能的第三个高点。
我有几个问题:) a) 如何寻找次高? b) 如何知道两个高点的位置(对于简单的斜率:slope = (MaxHigh2-MaxHigh1)/(PosMaxHigh2-PosMaxHigh1))?
我当然可以做这样的事情。但我只有在 high1 > high2 时才工作:) 而且我不会有相同范围的高点。
import quandl
import pandas as pd
import numpy as np
import sys
df = quandl.get("WIKI/GOOGL")
df = df.ix[:10, ['High', 'Close' ]]
df['MAX_HIGH_3P'] = df['High'].rolling(window=3,center=False).max()
df['MAX_HIGH_5P'] = df['High'].rolling(window=5,center=False).max()
df['SLOPE'] = (df['MAX_HIGH_5P']-df['MAX_HIGH_3P'])/(5-3)
print(df.head(20).to_string())
抱歉,解决方案有点乱,但希望对您有所帮助:
首先我定义了一个函数,它将 numpy 数组作为输入,检查是否至少有 2 个元素不为空,然后计算斜率(根据您的公式 - 我认为),如下所示:
def calc_slope(input_list):
if sum(~np.isnan(x) for x in input_list) < 2:
return np.NaN
temp_list = input_list[:]
max_value = np.nanmax(temp_list)
max_index = np.where(input_list == max_value)[0][0]
temp_list = np.delete(temp_list, max_index)
second_max = np.nanmax(temp_list)
second_max_index = np.where(input_list == second_max)[0][0]
return (max_value - second_max)/(1.0*max_index-second_max_index)
在变量 df 中我有这个:
你只需要将滚动 window 应用于你喜欢的任何东西,例如应用于 "High":
df['High'].rolling(window=5, min_periods=2, center=False).apply(lambda x: calc_slope(x))
最终结果如下所示:
如果您愿意,也可以将其存储在其他列中:
df['High_slope'] = df['High'].rolling(window=5, min_periods=2, center=False).apply(lambda x: calc_slope(x))
这是你想要的吗?