基于概念的文本摘要(抽象)
Concept Based Text Summarization (Abstraction)
我正在寻找一种引擎,它可以根据句子的概念或含义进行 AI 文本摘要,我查看了像 (ginger, paraphrase, ace) 这样的开源项目,但它们没有做这项工作。
他们的工作方式是尝试为每个单词找到同义词并替换为当前单词,这样他们会生成很多句子的替代词,但大多数时候意思是错误的。
我曾与斯坦福的引擎合作,为一篇文章做一些类似高亮显示的事情,并在此基础上提取最重要的句子,但这仍然不是抽象,而是提取。
我正在寻找的引擎会随着时间的推移学习并且每次总结后结果都会得到改进,这也是有道理的。
请在这里帮忙,非常感谢你的帮助!
我不知道有哪个开源项目符合您对抽象和我假设的含义的要求。
但是我有一个想法如何构建这样的引擎以及如何训练它。
简而言之,我想我们都在脑海中记住了一些类似贝叶斯网络的结构,它不仅可以帮助我们对一些数据进行分类,还可以形成关于文本或消息的抽象含义。
由于不可能从我们的脑海中提取所有抽象类别结构,我认为最好建立允许逐步重建它的机制。
摘要
所提出的解决方案的关键思想是使用更易于从自动化计算机系统操作的方法提取对话的含义。这将允许创建与另一个人进行真实对话的良好幻觉。
提议的模型支持两个抽象级别:
首先,复杂度较低的级别在于将词组或单个词识别为与类别、实例或实例属性相关的组。
实例是指从真实的或抽象的主体、对象、动作、属性或其他种类的实例的一般范畴中实例化。举个例子——两个或多个主体之间的具体关系:雇主和雇员之间的具体关系,具体的城市和所在国家等。
这种基本的意义识别方法使我们能够创建具有维持对话能力的机器人。这种能力基于对意义基本要素的识别:类别、实例和实例属性。
其次,最复杂的方法是基于场景识别并将它们存储到与instances/categories的对话上下文中,并使用它们来完成一些已识别的场景。
相关场景将用于完成对话的下一条消息,一些场景可用于生成下一条消息或通过使用条件和使用上下文中的意义元素来识别意义元素。
类似的东西:
基本分类应手动输入,并与未来 correction/addition 的教师一起输入。
会话中的句子中的单词和句子中的场景可以从上下文中填充
对话scenarios/categories可以通过先前识别的实例或未来对话中描述的实例来完成(自学)
图1 – 文字detection/categorization基本上是流动视觉
图2——通用系统视觉大图
图3-意元素分类
图 4 – 基本上类别结构可能是这样的
我正在寻找一种引擎,它可以根据句子的概念或含义进行 AI 文本摘要,我查看了像 (ginger, paraphrase, ace) 这样的开源项目,但它们没有做这项工作。 他们的工作方式是尝试为每个单词找到同义词并替换为当前单词,这样他们会生成很多句子的替代词,但大多数时候意思是错误的。
我曾与斯坦福的引擎合作,为一篇文章做一些类似高亮显示的事情,并在此基础上提取最重要的句子,但这仍然不是抽象,而是提取。
我正在寻找的引擎会随着时间的推移学习并且每次总结后结果都会得到改进,这也是有道理的。
请在这里帮忙,非常感谢你的帮助!
我不知道有哪个开源项目符合您对抽象和我假设的含义的要求。
但是我有一个想法如何构建这样的引擎以及如何训练它。
简而言之,我想我们都在脑海中记住了一些类似贝叶斯网络的结构,它不仅可以帮助我们对一些数据进行分类,还可以形成关于文本或消息的抽象含义。
由于不可能从我们的脑海中提取所有抽象类别结构,我认为最好建立允许逐步重建它的机制。
摘要
所提出的解决方案的关键思想是使用更易于从自动化计算机系统操作的方法提取对话的含义。这将允许创建与另一个人进行真实对话的良好幻觉。
提议的模型支持两个抽象级别:
首先,复杂度较低的级别在于将词组或单个词识别为与类别、实例或实例属性相关的组。
实例是指从真实的或抽象的主体、对象、动作、属性或其他种类的实例的一般范畴中实例化。举个例子——两个或多个主体之间的具体关系:雇主和雇员之间的具体关系,具体的城市和所在国家等。 这种基本的意义识别方法使我们能够创建具有维持对话能力的机器人。这种能力基于对意义基本要素的识别:类别、实例和实例属性。
其次,最复杂的方法是基于场景识别并将它们存储到与instances/categories的对话上下文中,并使用它们来完成一些已识别的场景。
相关场景将用于完成对话的下一条消息,一些场景可用于生成下一条消息或通过使用条件和使用上下文中的意义元素来识别意义元素。
类似的东西:
基本分类应手动输入,并与未来 correction/addition 的教师一起输入。
会话中的句子中的单词和句子中的场景可以从上下文中填充
对话scenarios/categories可以通过先前识别的实例或未来对话中描述的实例来完成(自学)
图1 – 文字detection/categorization基本上是流动视觉
图2——通用系统视觉大图
图3-意元素分类
图 4 – 基本上类别结构可能是这样的