在存储的 DataFrame 中创建新列的字典理解
Dictionary Comprehension to Create New Columns in Stored DataFrames
我有一本字典,其值为 Pandas DataFrames。我想在每个 DataFrame 中创建新列。我可以很容易地使用 for 循环,但我想要一种更 pythonic 的方式来做这件事。字典理解似乎是一种理想的方式。这将如何使用字典理解来完成?
df1 = pd.DataFrame(data =[['2013',98],['2014',100],['2015',110],
['2016',110],['2017',115]],
columns = ['Year','Value'])
df2 = pd.DataFrame(data =[['2013',85],['2014',90],['2015',95],
['2016',97],['2017',99]],
columns = ['Year','Value'])
df3 = pd.DataFrame(data =[['2013',30],['2014',28],['2015',25],
['2016',28],['2017',32]],
columns = ['Year','Value'])
d1 = {}
d1['df1'] = df1
d1['df2'] = df2
d1['df3'] = df3
for k in d1.keys():
d1[k]['shifted'] = d1[k]['Value'].shift(2)
您可以创建一个在字典理解中调用的小辅助函数:
def add_shifted_col(df):
df['shifted'] = df['Value'].shift(2)
return df
{k: add_shifted_col(v) for k, v in d1.items()}
编辑:字典理解创建了一个新字典。要用这个更新原始文件,您可以调用:
d1.update({k: add_shifted_col(v) for k, v in d1.items()})
如果您只想有条件地向所选数据帧添加额外系列,这会很有帮助,例如
update_these = ['df2', 'df3']
d1.update({k: add_shifted_col(v) for k, v in d1.items() if k in update_these})
在此示例中,将向 df2 和 df3 添加一个额外的系列,但不会更改 df1。
你可以试试 concat
和 keys
l=[df1,df2,df3]
newdf=pd.concat(l,keys=['df1','df2','df3'])
newdf['shifted']=newdf.groupby(level=0).Value.shift(2)
newdf
Out[437]:
Year Value shifted
df1 0 2013 98 NaN
1 2014 100 NaN
2 2015 110 98.0
3 2016 110 100.0
4 2017 115 110.0
df2 0 2013 85 NaN
1 2014 90 NaN
2 2015 95 85.0
3 2016 97 90.0
4 2017 99 95.0
df3 0 2013 30 NaN
1 2014 28 NaN
2 2015 25 30.0
3 2016 28 28.0
4 2017 32 25.0
获取 df1
newdf.loc['df1']
Out[438]:
Year Value shifted
0 2013 98 NaN
1 2014 100 NaN
2 2015 110 98.0
3 2016 110 100.0
4 2017 115 110.0
我有一本字典,其值为 Pandas DataFrames。我想在每个 DataFrame 中创建新列。我可以很容易地使用 for 循环,但我想要一种更 pythonic 的方式来做这件事。字典理解似乎是一种理想的方式。这将如何使用字典理解来完成?
df1 = pd.DataFrame(data =[['2013',98],['2014',100],['2015',110],
['2016',110],['2017',115]],
columns = ['Year','Value'])
df2 = pd.DataFrame(data =[['2013',85],['2014',90],['2015',95],
['2016',97],['2017',99]],
columns = ['Year','Value'])
df3 = pd.DataFrame(data =[['2013',30],['2014',28],['2015',25],
['2016',28],['2017',32]],
columns = ['Year','Value'])
d1 = {}
d1['df1'] = df1
d1['df2'] = df2
d1['df3'] = df3
for k in d1.keys():
d1[k]['shifted'] = d1[k]['Value'].shift(2)
您可以创建一个在字典理解中调用的小辅助函数:
def add_shifted_col(df):
df['shifted'] = df['Value'].shift(2)
return df
{k: add_shifted_col(v) for k, v in d1.items()}
编辑:字典理解创建了一个新字典。要用这个更新原始文件,您可以调用:
d1.update({k: add_shifted_col(v) for k, v in d1.items()})
如果您只想有条件地向所选数据帧添加额外系列,这会很有帮助,例如
update_these = ['df2', 'df3']
d1.update({k: add_shifted_col(v) for k, v in d1.items() if k in update_these})
在此示例中,将向 df2 和 df3 添加一个额外的系列,但不会更改 df1。
你可以试试 concat
和 keys
l=[df1,df2,df3]
newdf=pd.concat(l,keys=['df1','df2','df3'])
newdf['shifted']=newdf.groupby(level=0).Value.shift(2)
newdf
Out[437]:
Year Value shifted
df1 0 2013 98 NaN
1 2014 100 NaN
2 2015 110 98.0
3 2016 110 100.0
4 2017 115 110.0
df2 0 2013 85 NaN
1 2014 90 NaN
2 2015 95 85.0
3 2016 97 90.0
4 2017 99 95.0
df3 0 2013 30 NaN
1 2014 28 NaN
2 2015 25 30.0
3 2016 28 28.0
4 2017 32 25.0
获取 df1
newdf.loc['df1']
Out[438]:
Year Value shifted
0 2013 98 NaN
1 2014 100 NaN
2 2015 110 98.0
3 2016 110 100.0
4 2017 115 110.0