按 python 中的索引绘制字符串数据

plot string data by index in python

我有一个格式如下的数据集:

             query_phone         Day   Actor      ObjGrp
0              495393475  2017-09-21   Joana      din
1              676793475  2017-09-21   marta      ver
2              806494953  2017-09-21   joao       hav
3              595243631  2017-09-21   mark       din
4              444709531  2017-09-25   caty       ver
5              447159403  2017-09-25   rodin      tug
6              762976443  2017-09-25   rodin      tug
7              865853581  2017-09-25   john       han
8              441331962  2017-09-25   van        ver
9              261331962  2017-09-25   van        ver
10             455924196  2017-09-25   david      wog

我可以,数据框有 80000 行。

我想绘制它的分布图。我的意思是绘制一条线,针对每个组合 phone、day、actor 和 objgrp 告诉我该实例出现了多少次,这样我就可以分辨出重复行为。

有人知道怎么做吗?我找到的所有绘图方式,不仅不接受字符串类型,也不让我选择y轴作为数量。

谢谢,

在此 Post 中有一个讨论,@DSM 展示了如何在给定列中连接具有相同值的条目,正如原始 post 作者所建议的那样:

pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)

这是假设您将数据作为 pandas 数据框打开。

如果你看一下 groupby 函数 documentation 你会注意到你可以将这些元素按不止一列分组,如果我正确理解你的问题,将 return 给你一个列表,你可以在其中轻松查看重复并研究它们的频率。