Pandas dataframe:将列中的日期转换为行中的值
Pandas dataframe: turn date in column into value in row
我正在尝试转换以下数据框(包含县和年份的值)
county region 2012 2013 ... 2035
A 101 10 15 ... 7
B 101 13 8 ... 11
...
进入如下所示的数据框:
county region year sum
A 101 2012 10
A 101 2013 15
... ... ... ...
A 101 2035 7
B 101 2012 13
B 101 2013 8
B 101 2035 11
我当前的数据框有 400 行(不同的县),其中包含 2012-2035 年的值。
我的手动方法是切掉年份列并将它们中的每一个都放在前一年的最后一行下面。但是当然必须有一个pythonic方式。
我想我在这里遗漏了一个基本的 pandas 概念,可能我只是找不到这个问题的正确答案,因为我根本不知道如何提出正确的问题。请对新人温柔一点
您可以使用 melt
来自 pandas:
In [26]: df
Out[26]:
county region 2012 2013
0 A 101 10 15
1 B 101 13 8
In [27]: pd.melt(df, id_vars=['county','region'], var_name='year', value_name='sum')
Out[27]:
county region year sum
0 A 101 2012 10
1 B 101 2012 13
2 A 101 2013 15
3 B 101 2013 8
我正在尝试转换以下数据框(包含县和年份的值)
county region 2012 2013 ... 2035
A 101 10 15 ... 7
B 101 13 8 ... 11
...
进入如下所示的数据框:
county region year sum
A 101 2012 10
A 101 2013 15
... ... ... ...
A 101 2035 7
B 101 2012 13
B 101 2013 8
B 101 2035 11
我当前的数据框有 400 行(不同的县),其中包含 2012-2035 年的值。
我的手动方法是切掉年份列并将它们中的每一个都放在前一年的最后一行下面。但是当然必须有一个pythonic方式。
我想我在这里遗漏了一个基本的 pandas 概念,可能我只是找不到这个问题的正确答案,因为我根本不知道如何提出正确的问题。请对新人温柔一点
您可以使用 melt
来自 pandas:
In [26]: df
Out[26]:
county region 2012 2013
0 A 101 10 15
1 B 101 13 8
In [27]: pd.melt(df, id_vars=['county','region'], var_name='year', value_name='sum')
Out[27]:
county region year sum
0 A 101 2012 10
1 B 101 2012 13
2 A 101 2013 15
3 B 101 2013 8