SQL 使用熊猫库执行查询
SQL query execution using panda library
我有一个这样的 SQL 查询“select (ShipMode),(count(OrderID)*100/8994) as Score from friends.sampledatapanda(我有一个 CSV 文件,所以忽略这个)
按 1”分组。我想在 Jupyter 上使用熊猫库执行相同的操作。
请帮忙。
您可以使用pandas'value_counts()
方法计算值的个数,并使用normalize=True
参数获取频率。假设您已将数据读入名为 df
:
的 DataFrame
df['Ship Mode'].value_counts(normalize=True)
Out[3]:
Standard Class 0.597158
Second Class 0.194617
First Class 0.153892
Same Day 0.054333
Name: Ship Mode, dtype: float64
我有一个这样的 SQL 查询“select (ShipMode),(count(OrderID)*100/8994) as Score from friends.sampledatapanda(我有一个 CSV 文件,所以忽略这个) 按 1”分组。我想在 Jupyter 上使用熊猫库执行相同的操作。 请帮忙。
您可以使用pandas'value_counts()
方法计算值的个数,并使用normalize=True
参数获取频率。假设您已将数据读入名为 df
:
df['Ship Mode'].value_counts(normalize=True)
Out[3]:
Standard Class 0.597158
Second Class 0.194617
First Class 0.153892
Same Day 0.054333
Name: Ship Mode, dtype: float64