问:机器学习模型能否解决基于规则的问题?

Q: Can a Machine Learning model solve rule-based problems?

机器学习能否用于验证语句或捕获文本文档中的错误?

例如,如果您教分类器 "You should eat apples twice per day",但在您正在测试的文档中,语句是 "You should eat apples three times per day",是否可以标记该语句?

显然,您可以构建一些基于规则的软件来捕捉这些,但我的问题围绕着训练 ML 模型以捕捉这些,随着规则的变化。

我看过 word2vec 和 NLTK 并用它们进行了一些测试,但无法连接点来教授分类器。

如果可能的话,人们将如何着手或提供一些指导?

谢谢,道格

(评论时间太长了。)

是的,可以。然而,它非常复杂。这种推理和分析例如由Watson完成。 IBM 将这些称为认知计算。当您编写基于规则(或逻辑推理)的系统时,可以解决此类任务。所以你应该问自己的问题是如何从文本中提取所需的事实。 => NLP , Part Of Speech, Named Entity,... 然而,这项任务非常艰巨,因为“每天不超过 100 次”与句子并不矛盾。所以推理需要丰富的背景知识。

如前所述,这是一个非常广泛的话题。您将不得不勾勒出解决方案,然后选择一小部分,这将被称为博士论文;)。 这张漂亮的图片说明了这一点 http://matt.might.net/articles/phd-school-in-pictures/

因此,为博士论文寻找合适的关键字出现了 http://nakashole.com/papers/2012-phd-thesis.pdf。这个可能会让你读几个晚上。

如果您想动手尝试使用 NLTK,我会为您要分析的句子生成解析树。之后您可以尝试对齐这些并检查重叠和偏差。但是我不确定如何得出结论。一个稍微简单的版本是逐字匹配。 Levenstein 距离计算中的一些东西。