问：机器学习模型能否解决基于规则的问题？

Q: Can a Machine Learning model solve rule-based problems?

机器学习能否用于验证语句或捕获文本文档中的错误？

例如，如果您教分类器 "You should eat apples twice per day"，但在您正在测试的文档中，语句是 "You should eat apples three times per day"，是否可以标记该语句？

显然，您可以构建一些基于规则的软件来捕捉这些，但我的问题围绕着训练 ML 模型以捕捉这些，随着规则的变化。

我看过 word2vec 和 NLTK 并用它们进行了一些测试，但无法连接点来教授分类器。

如果可能的话，人们将如何着手或提供一些指导？

谢谢，道格

（评论时间太长了。）

是的，可以。然而，它非常复杂。这种推理和分析例如由Watson完成。 IBM 将这些称为认知计算。当您编写基于规则（或逻辑推理）的系统时，可以解决此类任务。所以你应该问自己的问题是如何从文本中提取所需的事实。 => NLP , Part Of Speech, Named Entity,... 然而，这项任务非常艰巨，因为“每天不超过 100 次”与句子并不矛盾。所以推理需要丰富的背景知识。

如前所述，这是一个非常广泛的话题。您将不得不勾勒出解决方案，然后选择一小部分，这将被称为博士论文；）。这张漂亮的图片说明了这一点 http://matt.might.net/articles/phd-school-in-pictures/

因此，为博士论文寻找合适的关键字出现了 http://nakashole.com/papers/2012-phd-thesis.pdf。这个可能会让你读几个晚上。

如果您想动手尝试使用 NLTK，我会为您要分析的句子生成解析树。之后您可以尝试对齐这些并检查重叠和偏差。但是我不确定如何得出结论。一个稍微简单的版本是逐字匹配。 Levenstein 距离计算中的一些东西。

问：机器学习模型能否解决基于规则的问题？

Q: Can a Machine Learning model solve rule-based problems?

machine-learning

nltk

word2vec