使用 pandas 基于 Cover_Type 计算数据

Counting Data based on Cover_Type using pandas

我在 excel sheet!

中有以下数据

我需要计算给定 cover_type 的给定海拔出现的次数。例如,elevation=1905 在 cover_type=6 时出现两次,在 cover_type=3 时出现一次。我需要做同样的 Aspect、Slope、Horizontal_Distance_To_Hydrology、Vertical_Distance_To_Hydrology、Horizontal_Distance_To_Roadways、Hillshade_9am、Hillshade_Noon、Hillshade_3pm、Horizontal_Distance_To_Fire_Points, 土, Wilderness_Area.

我将使用计数来计算每列的熵。我需要执行这个公式。

您可以执行以下操作

import pandas as pd
df = pd.read_csv('train_data.csv')
grouped = df[['elevation','cover_type']].groupby(['elevation','cover_type'], as_index = False, sort = False)['cover_type'].count()