计算均值时如何选择列

Question

你好我是学生学习python。

有什么区别

df.1.mean()
df[1].mean()

?

完整代码是

df= pd.DataFrame(np.random.randn(10,4)) 
df[1].mean()

我很困惑，因为我之前使用第一种方法在不同的数据框中选择列。

Answer 1

对于数字列，调用df.1会报错。

但是您可以将它用于字符串的列名。

# create new column with string column name
df['new_col'] = np.random.randn()
# get mean 
df.new_col.mean()

Answer 2

如果列的名称是一个字符串，例如“one”，那么它将起作用，因为 df.one 是 df 的属性“one”。不幸的是，属性语法不适用于纯整数（数字），只能在方括号中作为 df[1] 正确处理它们。

df = pd.DataFrame({1:[2,3], 'one':[3,5]})
df.one #works
#df.1 # syntax error

how to choose columns when calculating mean