计算均值时如何选择列

how to choose columns when calculating mean

你好我是学生学习python。

有什么区别

df.1.mean()
df[1].mean()

?

完整代码是

df= pd.DataFrame(np.random.randn(10,4)) 
df[1].mean()

我很困惑,因为我之前使用第一种方法在不同的数据框中选择列。

对于数字列,调用df.1会报错。

但是您可以将它用于字符串的列名。

# create new column with string column name
df['new_col'] = np.random.randn()
# get mean 
df.new_col.mean()

如果列的名称是一个字符串,例如“one”,那么它将起作用,因为 df.one 是 df 的属性“one”。不幸的是,属性语法不适用于纯整数(数字),只能在方括号中作为 df[1] 正确处理它们。

df = pd.DataFrame({1:[2,3], 'one':[3,5]})
df.one #works
#df.1 # syntax error