在月初开始增量列

Question

提前感谢您的帮助。

想要在月份发生变化时将 'Counter' 设置为 1，并递增 1 直到月份再次发生变化，然后重复。像这样：

                     A          Month Counter
        2015-10-30  -1.478066   10    21
        2015-10-31  -1.562437   10    22
        2015-11-01  -0.292285   11    1
        2015-11-02  -1.581140   11    2
        2015-11-03  0.603113    11    3
        2015-11-04  -0.543563   11    4

In [1]: import pandas as pd
          import numpy as np

In [2]: dates = pd.date_range('20151030',periods=6)

In [3]: df =pd.DataFrame(np.random.randn(6,1),index=dates,columns=list('A'))

In [4]: df
Out[4]:             A
        2015-10-30  -1.478066
        2015-10-31  -1.562437
        2015-11-01  -0.292285
        2015-11-02  -1.581140
        2015-11-03  0.603113
        2015-11-04  -0.543563

试过了，实际月份整数加 1：

In [5]: df['Month'] = df.index.month

In [6]: df['Counter'] df['Counter']=np.where(df['Month'] <> df['Month'], (1), (df['Month'].shift()+1))

In [7]: df
Out[7]:  A                     Month Counter
        2015-10-30  -1.478066   10  NaN
        2015-10-31  -1.562437   10  11
        2015-11-01  -0.292285   11  11
        2015-11-02  -1.581140   11  12
        2015-11-03  0.603113    11  12
        2015-11-04  -0.543563   11  12

尝试了日期时间，越来越近了：

In[8]:  from datetime import timedelta

In[9]:  df['Counter'] = df.index + timedelta(days=1)
Out[9]:     A                      Month    Counter
            2015-10-30  -0.478066   11  2015-10-31
            2015-10-31  -1.562437   10  2015-11-01
            2015-11-01  -0.292285   11  2015-11-02
            2015-11-02  -1.581140   11  2015-11-03
            2015-11-03  0.603113    11  2015-11-04
            2015-11-04  -0.543563   11  2015-11-05

后者给我日期，但不是我的专柜。 python 的新手，如有任何帮助，我们将不胜感激。谢谢！

编辑，将 df 扩展到 periods=300 以包含超过 12 个月的数据：

In[10]: dates = pd.date_range('19971002',periods=300)
In[11]: df=pd.DataFrame(np.random.randn(300,1),index=dates,columns=list('A'))
In[12]: df['Counter'] = df.groupby(df.index.month).cumcount()+1
In[13]: df.head()
Out[13]             A          Counter
        1997-09-29  -0.875468   20
        1997-09-30   1.498145   21
        1997-10-02   0.141262   1
        1997-10-03   0.581974   2
        1997-10-04   0.581974   3

In[14]: df[250:]
Out[14]             A          Counter
        1998-09-29  -0.875468   20
        1998-09-30   1.498145   21
        1998-10-01   0.141262   24
        1998-10-02   0.581974   25

期望的结果：

Out[13]             A          Counter
        1997-09-29  -0.875468   20
        1997-09-30   1.498145   21
        1997-10-02   0.141262   1
        1997-10-03   0.581974   2
        1997-10-04   0.581974   3

代码工作正常（上面的 Out[13]），似乎一旦数据超过 12 个月，计数器就会继续递增 +1，而不是设置回上面的 1（[Out 14]。另外，这里变得棘手，随机日期生成器包括周末，我的数据只有工作日数据。希望对我有帮助，帮助你更好地帮助我。谢谢！

Answer 1

您可以使用 groupby/cumcount 为每个组分配一个累积计数：

import pandas as pd
import numpy as np

N = 300
dates = pd.date_range('19971002', periods=N, freq='B')
df = pd.DataFrame(np.random.randn(N, 1),index=dates,columns=list('A'))
df['Counter'] = df.groupby([df.index.year, df.index.month]).cumcount()+1
print(df.loc['1998-09-25':'1998-10-05'])

产量

                   A  Counter
1998-09-25 -0.511721       19
1998-09-28  1.912757       20
1998-09-29 -0.988309       21
1998-09-30  1.277888       22
1998-10-01 -0.579450        1
1998-10-02 -2.486014        2
1998-10-05  0.728789        3

在月初开始增量列

Start increment column at begining of month

python

datetime

counter

timedelta

pandas