SVM机器学习算法如何转换String数据
How String data is converted for SVM machine learning algorithm
我有一个数据集,即
<table>
<tr><td>TEXT</td><td>TYPE</td></tr>
<tr><td>100% free cashback </td><td>spam</td></tr>
<tr><td>hello how are you </td><td>ham</td></tr>
<tr><td>click on this link to get free sms plan</td><td>spam</td></tr></table>
我想知道 SVM 机器学习算法如何将此文本列转换为在图表上绘制,以便它可以推断出一条将垃圾邮件与正常邮件分开的线。
我知道spam和ham可以分别转换为0,1。但是如何将此文本列转换为数值??
注:我要程序。我想用笔和纸手动完成,而不是使用一些 python 库的代码。
只是为了让我们在同一页面上:
您正在寻找有关如何解决垃圾邮件与垃圾邮件的程序。使用笔和纸对火腿电子邮件进行分类。
从基础开始,文本数据不能直接发送到模型,
1. 我们需要进行数据清理,以便我们将多个 traits/features 提取为矩阵形式(1 行 = 1 封电子邮件,1 列 = 1 个特征)一个 feature/trait 可以是任何深度嵌入上的单词电子邮件的 (Doc2Vec)。
2.以同样的方式,我们还创建了一个目标数据(1行表示垃圾邮件为1,非垃圾邮件为0)
获得这两个数据后,您可以假设所有列在 N 维数据平面中都是不同的轴,从而手动求解 SVM 算法。
我有一个数据集,即
<table>
<tr><td>TEXT</td><td>TYPE</td></tr>
<tr><td>100% free cashback </td><td>spam</td></tr>
<tr><td>hello how are you </td><td>ham</td></tr>
<tr><td>click on this link to get free sms plan</td><td>spam</td></tr></table>
我想知道 SVM 机器学习算法如何将此文本列转换为在图表上绘制,以便它可以推断出一条将垃圾邮件与正常邮件分开的线。
我知道spam和ham可以分别转换为0,1。但是如何将此文本列转换为数值??
注:我要程序。我想用笔和纸手动完成,而不是使用一些 python 库的代码。
只是为了让我们在同一页面上: 您正在寻找有关如何解决垃圾邮件与垃圾邮件的程序。使用笔和纸对火腿电子邮件进行分类。
从基础开始,文本数据不能直接发送到模型, 1. 我们需要进行数据清理,以便我们将多个 traits/features 提取为矩阵形式(1 行 = 1 封电子邮件,1 列 = 1 个特征)一个 feature/trait 可以是任何深度嵌入上的单词电子邮件的 (Doc2Vec)。 2.以同样的方式,我们还创建了一个目标数据(1行表示垃圾邮件为1,非垃圾邮件为0) 获得这两个数据后,您可以假设所有列在 N 维数据平面中都是不同的轴,从而手动求解 SVM 算法。