按 python 中的索引绘制字符串数据
plot string data by index in python
我有一个格式如下的数据集:
query_phone Day Actor ObjGrp
0 495393475 2017-09-21 Joana din
1 676793475 2017-09-21 marta ver
2 806494953 2017-09-21 joao hav
3 595243631 2017-09-21 mark din
4 444709531 2017-09-25 caty ver
5 447159403 2017-09-25 rodin tug
6 762976443 2017-09-25 rodin tug
7 865853581 2017-09-25 john han
8 441331962 2017-09-25 van ver
9 261331962 2017-09-25 van ver
10 455924196 2017-09-25 david wog
我可以,数据框有 80000 行。
我想绘制它的分布图。我的意思是绘制一条线,针对每个组合 phone、day、actor 和 objgrp 告诉我该实例出现了多少次,这样我就可以分辨出重复行为。
有人知道怎么做吗?我找到的所有绘图方式,不仅不接受字符串类型,也不让我选择y轴作为数量。
谢谢,
在此 Post 中有一个讨论,@DSM 展示了如何在给定列中连接具有相同值的条目,正如原始 post 作者所建议的那样:
pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)
这是假设您将数据作为 pandas 数据框打开。
如果你看一下 groupby 函数 documentation 你会注意到你可以将这些元素按不止一列分组,如果我正确理解你的问题,将 return 给你一个列表,你可以在其中轻松查看重复并研究它们的频率。
我有一个格式如下的数据集:
query_phone Day Actor ObjGrp
0 495393475 2017-09-21 Joana din
1 676793475 2017-09-21 marta ver
2 806494953 2017-09-21 joao hav
3 595243631 2017-09-21 mark din
4 444709531 2017-09-25 caty ver
5 447159403 2017-09-25 rodin tug
6 762976443 2017-09-25 rodin tug
7 865853581 2017-09-25 john han
8 441331962 2017-09-25 van ver
9 261331962 2017-09-25 van ver
10 455924196 2017-09-25 david wog
我可以,数据框有 80000 行。
我想绘制它的分布图。我的意思是绘制一条线,针对每个组合 phone、day、actor 和 objgrp 告诉我该实例出现了多少次,这样我就可以分辨出重复行为。
有人知道怎么做吗?我找到的所有绘图方式,不仅不接受字符串类型,也不让我选择y轴作为数量。
谢谢,
在此 Post 中有一个讨论,@DSM 展示了如何在给定列中连接具有相同值的条目,正如原始 post 作者所建议的那样:
pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)
这是假设您将数据作为 pandas 数据框打开。
如果你看一下 groupby 函数 documentation 你会注意到你可以将这些元素按不止一列分组,如果我正确理解你的问题,将 return 给你一个列表,你可以在其中轻松查看重复并研究它们的频率。