逻辑语义、信息提取和总结

Logical Semantics, Information Extraction and Summarization

我想知道关于这些问题的大概思路,在数据分析和NLP领域。 包括哪些步骤?如果我想从任何特定领域的文本中检索有意义的信息并理解任何文本的一般思想。

另外一个问题,分析的文本越大越好吗?

原谅我的无知。我想了解更多,如果您建议一些教程或阅读材料,那会对我有很大帮助。

我建议 "Speech and Language Processing" 作者 Daniel Jurafsky 和 ​​James H. Martin。最后几章是关于信息提取和总结的。

至于您关于文字大小的问题,视情况而定。根据我的经验,信息提取对短句效果更好。但是,您将需要一个大数据集来训练您的系统识别相关模式。