Watson Natural Language Classifier - 使用 类 的量表
Watson Natural Language Classifier - using a scale for classes
使用沃森的 NLC API 时,类 可以使用体重秤吗?例如,1-5 评级或 Yes/No/Maybe 分类?
我的训练数据包含新闻标题列表。对于每一个,我都有 "class" 不感兴趣、有点有趣和非常有趣。我想根据他们过去发现的有趣内容来预测 reader 是否会感兴趣的标题。因为它更像是一个预测 1 到 3 之间的数字的回归模型,所以我想知道分类器是否会为此应用程序正常工作。想法?
是的,您可以使用 1-5 评级(使用 5 个类别),它是否有效,很难说,因为这取决于您的数据:-)
但这是一个完全有效的方法。
NLC 将在幕后做的是从每个文本样本中提取含义,使用基于内部维基百科的方法计算一些语义距离 ontology,并且它将尝试创建一个基于以下概念的分类器每个示例文本。
因此,如果在您的文本示例中每个聚类之间存在内在的语义差异,那么使用 5 个类别将有效,因此分类器可以正确地收集相关的内容并区分不同的内容。
这里使用了相同的逻辑,in this recipe,使用 Watson Image 分类器而不是 NLC,但逻辑是相同的。
使用沃森的 NLC API 时,类 可以使用体重秤吗?例如,1-5 评级或 Yes/No/Maybe 分类?
我的训练数据包含新闻标题列表。对于每一个,我都有 "class" 不感兴趣、有点有趣和非常有趣。我想根据他们过去发现的有趣内容来预测 reader 是否会感兴趣的标题。因为它更像是一个预测 1 到 3 之间的数字的回归模型,所以我想知道分类器是否会为此应用程序正常工作。想法?
是的,您可以使用 1-5 评级(使用 5 个类别),它是否有效,很难说,因为这取决于您的数据:-)
但这是一个完全有效的方法。
NLC 将在幕后做的是从每个文本样本中提取含义,使用基于内部维基百科的方法计算一些语义距离 ontology,并且它将尝试创建一个基于以下概念的分类器每个示例文本。
因此,如果在您的文本示例中每个聚类之间存在内在的语义差异,那么使用 5 个类别将有效,因此分类器可以正确地收集相关的内容并区分不同的内容。
这里使用了相同的逻辑,in this recipe,使用 Watson Image 分类器而不是 NLC,但逻辑是相同的。