如何为多类 svm 格式化我的数据框

Question

我有一个巨大的数据框，我想运行一个多 class svm 模型，但我对如何格式化数据框感到困惑。这是数据框的样子：

x	y	class
x1	y1	1
x2	y2	2
x3	y3	3
x4	y4	4
etc	etc	etc

我实际上如何运行 svm 模型上的数据？谢谢

Answer 1

就这么办

X=df[['x','y']]
Y=df[['class']]

在此之后，您将在 X 中有列 x 和 y，在 Y 中有列 'class' 您可以将数据进一步拆分为 X_train、X_test、Y_train、Y_test 通过使用 sklearn 库中的 split 函数，您可以使用您选择的库实现 SVM 并执行后续程序。

有关实施 SVM

的更多信息，请参阅此 link

Answer 2

import pandas as pd
from sklearn import svm
df=pd.read_excel('Enter location of your dataset')
features=df[['x','y']]
classes=df[['class']]
clf = svm.SVC(features,classes)
clf.fit(X, y)

如何为多类 svm 格式化我的数据框

how do I format my dataframe for multiclass svm

python

svm

pandas