如何在数据框中的 apply() 中使用 shift() 并仍然访问完整系列?
How to use shift() within apply() in dataframe and still access full series?
我有一个数据框,我正在尝试根据将 lambda 应用于两列来创建新列。
closeunadj qtr_timedelta
date
2021-05-18 128.75 107
2021-05-19 130.21 108
2021-05-20 132.15 109
2021-05-21 132.30 110
2021-05-24 133.34 113
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 1021 entries, 2017-05-01 to 2021-05-24
Data columns (total 2 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 closeunadj 1021 non-null float64
1 qtr_timedelta 1021 non-null int64
dtypes: float64(1), int64(1)
memory usage: 63.9 KB
lambda 应该使用第二列中不断变化的移位计数值在第一列上计算简单的移位 return。
final_merge['qtr_gwth'] = final_merge[['closeunadj',
'qtr_timedelta']].apply(lambda x : x['closeunadj'] / x['closeunadj'].shift(x['qtr_timedelta']) - 1, axis=1)
但是,因为 apply() 是逐行 运行,所以我无法通过 shift() 访问完整的“closeunadj”系列来计算实际的 shift()。因此我得到一个“AttributeError: 'numpy.float64' object has no attribute ‘shift’”
如果我把分母改成
x.loc[:,’closeunadj’].shift(x[‘qtr_timedelta’])
尝试让 shift() 访问整个系列我得到“IndexingError:索引器太多”
非常感谢任何帮助或建议!
一种方法是对 apply
中的 shift
使用完整系列 final_merge['closeunadj']
,然后使用 loc
和 x.name
(即当前行的索引)以获得正确的值。不确定它是否最有效,但因为您的数据框大约有 1K 行,所以应该没问题
final_merge['qtr_gwth'] = (
final_merge[['closeunadj', 'qtr_timedelta']]
.apply(lambda x : x['closeunadj'] / final_merge['closeunadj'].shift(x['qtr_timedelta']).loc[x.name] - 1,
axis=1)
)
我有一个数据框,我正在尝试根据将 lambda 应用于两列来创建新列。
closeunadj qtr_timedelta
date
2021-05-18 128.75 107
2021-05-19 130.21 108
2021-05-20 132.15 109
2021-05-21 132.30 110
2021-05-24 133.34 113
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 1021 entries, 2017-05-01 to 2021-05-24
Data columns (total 2 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 closeunadj 1021 non-null float64
1 qtr_timedelta 1021 non-null int64
dtypes: float64(1), int64(1)
memory usage: 63.9 KB
lambda 应该使用第二列中不断变化的移位计数值在第一列上计算简单的移位 return。
final_merge['qtr_gwth'] = final_merge[['closeunadj',
'qtr_timedelta']].apply(lambda x : x['closeunadj'] / x['closeunadj'].shift(x['qtr_timedelta']) - 1, axis=1)
但是,因为 apply() 是逐行 运行,所以我无法通过 shift() 访问完整的“closeunadj”系列来计算实际的 shift()。因此我得到一个“AttributeError: 'numpy.float64' object has no attribute ‘shift’”
如果我把分母改成
x.loc[:,’closeunadj’].shift(x[‘qtr_timedelta’])
尝试让 shift() 访问整个系列我得到“IndexingError:索引器太多”
非常感谢任何帮助或建议!
一种方法是对 apply
中的 shift
使用完整系列 final_merge['closeunadj']
,然后使用 loc
和 x.name
(即当前行的索引)以获得正确的值。不确定它是否最有效,但因为您的数据框大约有 1K 行,所以应该没问题
final_merge['qtr_gwth'] = (
final_merge[['closeunadj', 'qtr_timedelta']]
.apply(lambda x : x['closeunadj'] / final_merge['closeunadj'].shift(x['qtr_timedelta']).loc[x.name] - 1,
axis=1)
)