计算均值时如何选择列
how to choose columns when calculating mean
你好我是学生学习python。
有什么区别
df.1.mean()
df[1].mean()
?
完整代码是
df= pd.DataFrame(np.random.randn(10,4))
df[1].mean()
我很困惑,因为我之前使用第一种方法在不同的数据框中选择列。
对于数字列,调用df.1
会报错。
但是您可以将它用于字符串的列名。
# create new column with string column name
df['new_col'] = np.random.randn()
# get mean
df.new_col.mean()
如果列的名称是一个字符串,例如“one”,那么它将起作用,因为 df.one 是 df 的属性“one”。不幸的是,属性语法不适用于纯整数(数字),只能在方括号中作为 df[1] 正确处理它们。
df = pd.DataFrame({1:[2,3], 'one':[3,5]})
df.one #works
#df.1 # syntax error
你好我是学生学习python。
有什么区别
df.1.mean()
df[1].mean()
?
完整代码是
df= pd.DataFrame(np.random.randn(10,4))
df[1].mean()
我很困惑,因为我之前使用第一种方法在不同的数据框中选择列。
对于数字列,调用df.1
会报错。
但是您可以将它用于字符串的列名。
# create new column with string column name
df['new_col'] = np.random.randn()
# get mean
df.new_col.mean()
如果列的名称是一个字符串,例如“one”,那么它将起作用,因为 df.one 是 df 的属性“one”。不幸的是,属性语法不适用于纯整数(数字),只能在方括号中作为 df[1] 正确处理它们。
df = pd.DataFrame({1:[2,3], 'one':[3,5]})
df.one #works
#df.1 # syntax error