自动摘要：基于提取

Automatic Summarization : Extraction Based

基于提取的自动摘要算法是什么？用谷歌搜索了很多，找不到与之相关的任何内容。我想在 python

上实施算法

没有一种算法可用于基于提取的摘要。有几种不同的算法可供选择。您应该选择适合您特定需求的一款。

基于提取的摘要有两种方法：

监督学习 - 您为程序提供大量文档示例及其关键字。该程序学习什么构成了关键字。然后你给它一个新文档，这次没有任何关键字，程序根据它在训练阶段学到的东西提取这个文档的关键字。有大量的监督学习技术。举几个例子，有神经网络、决策树、随机森林和支持向量机。
无监督学习——你只需给程序一个文档，它就会创建一个关键字列表，而不依赖于任何过去的经验。用于基于提取的摘要的一种流行的无监督算法是 TextRank。

首先，我认为您应该了解更多有关如何查找论文和研究的信息。到google还没有找到是绝对不可能的。无论如何，一些基于提取的文本摘要是：

简单易行的基于词频的方法
贝叶斯方法
基于图的方法，例如 TextRank/LexRank 是一个好的开始。
聚类
用于摘要的模糊系统
基于神经网络的系统
我见过基于优化算法的方法
我建议用谷歌搜索这些方法，看看你得到了什么。这些方法有很多变体，我真的无法说出哪种方法最好。记得也要找到合适的预处理工具。
祝你好运。