Pandas 数据帧索引

Question

假设我正在处理一个包含 10 列的数据集。现在，我的 'Y' 的标签列是 1。我如何设置我的 X 和 Y。这是我到目前为止所做的。

array = dataframe. values
X = array[:,0:2:32]   #I know this isn't the right way to do this.  
Y = array[:,1]

是的，我们可以为列分配名称并省略 name=label 的列，但我试图找到一种基于索引的直接方法。有线索吗？

Answer 1

你可以这样做：

Y = df.loc[:,1].values
cols = list(df.loc[:,:0]) + list(df.loc[:,2:32])
X = df[cols].values

Pandas dataframe indexes