Pandas 数据帧索引
Pandas dataframe indexes
假设我正在处理一个包含 10 列的数据集。
现在,我的 'Y' 的标签列是 1。
我如何设置我的 X 和 Y。
这是我到目前为止所做的。
array = dataframe. values
X = array[:,0:2:32] #I know this isn't the right way to do this.
Y = array[:,1]
是的,我们可以为列分配名称并省略 name=label 的列,但我试图找到一种基于索引的直接方法。有线索吗?
你可以这样做:
Y = df.loc[:,1].values
cols = list(df.loc[:,:0]) + list(df.loc[:,2:32])
X = df[cols].values
假设我正在处理一个包含 10 列的数据集。 现在,我的 'Y' 的标签列是 1。 我如何设置我的 X 和 Y。 这是我到目前为止所做的。
array = dataframe. values
X = array[:,0:2:32] #I know this isn't the right way to do this.
Y = array[:,1]
是的,我们可以为列分配名称并省略 name=label 的列,但我试图找到一种基于索引的直接方法。有线索吗?
你可以这样做:
Y = df.loc[:,1].values
cols = list(df.loc[:,:0]) + list(df.loc[:,2:32])
X = df[cols].values