来自 Pandas Python 的数据帧关联规则的事务 ID 列。
Column to Transacction ID for association rules on dataframes from Pandas Python.
我使用 Pandas 将 CSV 文件导入到 Python 中,我希望能够将其中一个用作事务 ID 的列,以便我制定关联规则。
(link: https://github.com/antonio1695/Python/blob/master/nearBPO/facturas.csv)
我希望有人能帮助我:
使用 UUID 作为我的交易 ID 来获得如下数据框:
UUID Desc
123ex Meat,Beer
为了让我获得关联规则,例如:{Meat} => {Beer}。
此外,如果有人建议图书馆以简单的方式这样做,我们将不胜感激。
感谢您的宝贵时间。
您可以通过执行以下操作将值聚合到列表中:
df.groupby('UUID')['Desc'].apply(list)
这会给你你想要的,如果你想把 UUID 作为一个列返回,你可以在上面调用 reset_index
:
df.groupby('UUID')['Desc'].apply(list).reset_index()
对于系列,您仍然可以将其导出为与 df 相同的 csv:
df.groupby('UUID')['Desc'].apply(list).to_csv(your_path)
您可能需要在导出之前命名您的索引,或者如果您发现更简单 reset_index
将索引恢复为列,然后调用 to_csv
我使用 Pandas 将 CSV 文件导入到 Python 中,我希望能够将其中一个用作事务 ID 的列,以便我制定关联规则。
(link: https://github.com/antonio1695/Python/blob/master/nearBPO/facturas.csv)
我希望有人能帮助我:
使用 UUID 作为我的交易 ID 来获得如下数据框:
UUID Desc
123ex Meat,Beer
为了让我获得关联规则,例如:{Meat} => {Beer}。
此外,如果有人建议图书馆以简单的方式这样做,我们将不胜感激。
感谢您的宝贵时间。
您可以通过执行以下操作将值聚合到列表中:
df.groupby('UUID')['Desc'].apply(list)
这会给你你想要的,如果你想把 UUID 作为一个列返回,你可以在上面调用 reset_index
:
df.groupby('UUID')['Desc'].apply(list).reset_index()
对于系列,您仍然可以将其导出为与 df 相同的 csv:
df.groupby('UUID')['Desc'].apply(list).to_csv(your_path)
您可能需要在导出之前命名您的索引,或者如果您发现更简单 reset_index
将索引恢复为列,然后调用 to_csv