使用 scikit learn 进行无监督机器学习

Unsupervised machine learning with scikit learn

我正在使用 scikit learn 学习无监督机器学习。我从网上收集了这些数据。当我尝试应用散点图时出现以下错误

IndexingError: Too many indexers

代码如下:

data = arff.loadarff("./Data/Arrhythmia/Arrhythmia_withoutdupl_02_v01.arff")
df = pd.DataFrame(data[0])
df = df.drop(['outlier',"id"],axis=1)
X_com = df.att10
plt.scatter(X_com.iloc[:,0],X_com.iloc[:,1])
plt.show()

我想在这里应用 KMeans 来自 scikit learn 的算法。我做错了什么?提前致谢

X_com 是一个 pd.Series,因此当您尝试使用 .iloc 对其进行切片时,您只能指定一个轴。

您可能想查看关于前两个特征的数据分布。然后你必须从初始数据集而不是系列中切出它(如@Alexandre 提到的)

data = arff.loadarff("./Data/Arrhythmia/Arrhythmia_withoutdupl_02_v01.arff")
df = pd.DataFrame(data[0])
df = df.drop(['outlier',"id"],axis=1)
plt.scatter(df.iloc[:,0],df.iloc[:,1])
plt.show()