Python 脚本摘要数据由 col 分隔
Python script summary data separate by col
我想根据另一列的条件对某列的数据库进行统计。
原始数据:
Time
Lot
Error
1:00
A
X
2:00
A
X
2:12
B
X
2:30
B
Y
4:29
C
Z
所需数据显示:
Lot
Error
Count
A
X
2
B
X
1
B
Y
1
C
Z
1
我尝试使用“groupby”和“pivot”,但它不起作用。
table = df.groupby(['Lot', 'Name']).sum('Name')
为两列尝试 count()。
df.groupby(['Lot', 'Error']).count()
输出
批次错误
A X 2
B X 1
Y 1
C Z 1
此外,如果您需要您提供的所有索引,那么您可以这样做:
df1 = df.groupby(['Lot', 'Error']).count().reset_index()
df1.rename(columns={'Time': 'count'}, inplace=True)
输出
Lot Error count
0 A X 2
1 B X 1
2 B Y 1
3 C Z 1
我想根据另一列的条件对某列的数据库进行统计。
原始数据:
Time | Lot | Error |
---|---|---|
1:00 | A | X |
2:00 | A | X |
2:12 | B | X |
2:30 | B | Y |
4:29 | C | Z |
所需数据显示:
Lot | Error | Count |
---|---|---|
A | X | 2 |
B | X | 1 |
B | Y | 1 |
C | Z | 1 |
我尝试使用“groupby”和“pivot”,但它不起作用。
table = df.groupby(['Lot', 'Name']).sum('Name')
为两列尝试 count()。
df.groupby(['Lot', 'Error']).count()
输出 批次错误
A X 2
B X 1
Y 1
C Z 1
此外,如果您需要您提供的所有索引,那么您可以这样做:
df1 = df.groupby(['Lot', 'Error']).count().reset_index()
df1.rename(columns={'Time': 'count'}, inplace=True)
输出
Lot Error count
0 A X 2
1 B X 1
2 B Y 1
3 C Z 1