文本分类——你能做什么 vs. 你的能力是什么?

Text Classification - what can you do vs. what are your capabilities?

文本分类主要作用于输入的训练句子。句子中很少或更少的变体确实有效。但是当出现

这样的场景时

What can you do <<==>> What are your capabilities

这种情况不适用于常规分类或机器人构建平台。

是否有任何分类方法可以帮助我实现这一目标?

您要解决的问题称为语义文本相似性,这是一个众所周知且研究充分的领域。

有很多不同的方法可以解决这个问题,无论您的数据是否被标记。 例如,Google 发布了 Universal Sentence Encoder (code example),它旨在判断两个句子是否像您的情况一样相似。

另一个例子是您可以在 Quora Question Pairs Kaggle competition.

中找到的任何解决方案

这个问题也有数据集,例如你可以找 SemEval STS(STS for Semantic Textual Similarity),或者 PAWS dataset