如何为多类 svm 格式化我的数据框
how do I format my dataframe for multiclass svm
我有一个巨大的数据框,我想 运行 一个多 class svm 模型,但我对如何格式化数据框感到困惑。这是数据框的样子:
x
y
class
x1
y1
1
x2
y2
2
x3
y3
3
x4
y4
4
etc
etc
etc
我实际上如何 运行 svm 模型上的数据?谢谢
就这么办
X=df[['x','y']]
Y=df[['class']]
在此之后,您将在 X 中有列 x 和 y,在 Y 中有列 'class' 您可以将数据进一步拆分为 X_train、X_test、Y_train、Y_test 通过使用 sklearn 库中的 split 函数,您可以使用您选择的库实现 SVM 并执行后续程序。
有关实施 SVM
的更多信息,请参阅此 link
import pandas as pd
from sklearn import svm
df=pd.read_excel('Enter location of your dataset')
features=df[['x','y']]
classes=df[['class']]
clf = svm.SVC(features,classes)
clf.fit(X, y)
我有一个巨大的数据框,我想 运行 一个多 class svm 模型,但我对如何格式化数据框感到困惑。这是数据框的样子:
x | y | class |
---|---|---|
x1 | y1 | 1 |
x2 | y2 | 2 |
x3 | y3 | 3 |
x4 | y4 | 4 |
etc | etc | etc |
我实际上如何 运行 svm 模型上的数据?谢谢
就这么办
X=df[['x','y']]
Y=df[['class']]
在此之后,您将在 X 中有列 x 和 y,在 Y 中有列 'class' 您可以将数据进一步拆分为 X_train、X_test、Y_train、Y_test 通过使用 sklearn 库中的 split 函数,您可以使用您选择的库实现 SVM 并执行后续程序。
有关实施 SVM
的更多信息,请参阅此 linkimport pandas as pd
from sklearn import svm
df=pd.read_excel('Enter location of your dataset')
features=df[['x','y']]
classes=df[['class']]
clf = svm.SVC(features,classes)
clf.fit(X, y)