pandas 系列中的真或假条纹

Streaks of True or False in pandas Series

我正在研究如何在 pandas 系列中显示 TrueFalse 的条纹。

数据:

p = pd.Series([True,False,True,True,True,True,False,False,True])

0     True
1    False
2     True
3     True
4     True
5     True
6    False
7    False
8     True
dtype: bool

我尝试了 p.diff() 但不确定如何计算它生成的 False 值以显示我的 期望输出 如下:.

0     0
1     0
2     0
3     1
4     2
5     3
6     0
7     1
8     0

您可以使用 cumcount of consecutives groups created by compare if p is not equal with shifted p and cumsum:

print (p.ne(p.shift()))
0     True
1     True
2     True
3    False
4    False
5    False
6     True
7    False
8     True
dtype: bool

print (p.ne(p.shift()).cumsum())
0    1
1    2
2    3
3    3
4    3
5    3
6    4
7    4
8    5
dtype: int32

print (p.groupby(p.ne(p.shift()).cumsum()).cumcount())
0    0
1    0
2    0
3    1
4    2
5    3
6    0
7    1
8    0
dtype: int64

感谢 提供另一个解决方案:

print (p.groupby(p.diff().cumsum()).cumcount())
0    0
1    0
2    0
3    1
4    2
5    3
6    0
7    1
8    0
dtype: int64 

另一种替代解决方案是创建 p Series 的累积总和并减去最近的累积总和,其中 p0。然后反转 p 并执行相同的操作。最后多个 Series 在一起:

c = p.cumsum()
a = c.sub(c.mask(p).ffill(), fill_value=0).sub(1).abs()
c = (~p).cumsum()
d = c.sub(c.mask(~(p)).ffill(), fill_value=0).sub(1).abs()

print (a)
0    0.0
1    1.0
2    0.0
3    1.0
4    2.0
5    3.0
6    1.0
7    1.0
8    0.0
dtype: float64

print (d)
0    1.0
1    0.0
2    1.0
3    1.0
4    1.0
5    1.0
6    0.0
7    1.0
8    1.0
dtype: float64
print (a.mul(d).astype(int))
0    0
1    0
2    0
3    1
4    2
5    3
6    0
7    1
8    0
dtype: int32