简单问答总结
Summarization of simple Q&A
有没有办法生成问答对的一句话摘要?
例如,提供:
Q: What is the color of the car?
A: Red
我想生成摘要
The color of the car is red
或者,给定
Q: Are you a man?
A: Yes
到
Yes, I am a man.
其中既有问题也有答案。
最合理的方法是什么?
我不知道有任何 NLP 任务可以明确处理您的要求。
大体上,有两种问题。需要一段话作为答案的问题,如定义或解释排序:What is Ebola Fever
。第二种是填空题,文献中称为Factoid Questions
,如What is the height of Mt. Everest?
。不清楚你想总结什么样的问题。我假设您对事实性问题感兴趣,因为您的示例仅涉及它们。
Question Answering
的任务中出现了一个非常相似的问题。此任务的第一阶段之一是生成查询。在论文中:对基本原理的探索
基于冗余的事实问题
接听; Jimmy Lin 2007,作者声称通过将查询(参见第 4.1 节)重新表述为更可能出现在自由文本中的形式,可以获得更好的性能。让我复制一些论文中讨论的例子。
1. What year did Alaska became a state?
2. Alaska became a state ?x
1. Who was the first person to run the miles in less than four minutes?
2. The first person to run the miles in less than four minutes was ?x
在上面的示例中,1
中的查询被重新表述为 2
。正如您可能已经观察到的那样,?x
是应该由答案填充的空白。这种重新制定是通过十几个手写规则进行的,并内置在论文中讨论的软件工具中:ARANEA
。你所要做的就是找到工具并使用它,这篇论文已经有十年了,不过我不能向你保证任何事情:)
希望这对您有所帮助。
我曾经不得不解决相反的问题,即从维基百科文章的句子中生成问题。
我使用 Stanford Parser 从训练数据集中所有可能的句子中生成解析树。
例如
- 转到http://nlp.stanford.edu:8080/parser/index.jsp
- 输入"The color of the car is red."并点击"Parse"。
- 然后查看响应的解析部分。该句子的第一层是 NP VP(名词短语后跟动词短语)。
第二层是NP PP VBZ ADJP.
我基本上收集了 1000 多个句子中的这些模式,对每个模式的常见程度进行了排序,然后想出了如何最好地修改这个解析树以转换成不同 Wh 问题(什么,谁)中的每个句子、何时、何地、为什么等)
你能不能轻松地做一些非常相似的事情。研究所有训练数据的解析树,找出可以提取哪些模式来完成工作。在许多情况下,只需将问题中的 Wh 词替换为答案,就可以得到一个有效但有些笨拙的短语句子。
例如"Red is the color of the car."
对于 "Are you a man?" 这样的问题(即基本动词是 'are'、'can'、'should' 等),通常交换前两个词成功了 - "You are a man?"
有没有办法生成问答对的一句话摘要?
例如,提供:
Q: What is the color of the car?
A: Red
我想生成摘要
The color of the car is red
或者,给定
Q: Are you a man?
A: Yes
到
Yes, I am a man.
其中既有问题也有答案。
最合理的方法是什么?
我不知道有任何 NLP 任务可以明确处理您的要求。
大体上,有两种问题。需要一段话作为答案的问题,如定义或解释排序:What is Ebola Fever
。第二种是填空题,文献中称为Factoid Questions
,如What is the height of Mt. Everest?
。不清楚你想总结什么样的问题。我假设您对事实性问题感兴趣,因为您的示例仅涉及它们。
Question Answering
的任务中出现了一个非常相似的问题。此任务的第一阶段之一是生成查询。在论文中:对基本原理的探索
基于冗余的事实问题
接听; Jimmy Lin 2007,作者声称通过将查询(参见第 4.1 节)重新表述为更可能出现在自由文本中的形式,可以获得更好的性能。让我复制一些论文中讨论的例子。
1. What year did Alaska became a state?
2. Alaska became a state ?x
1. Who was the first person to run the miles in less than four minutes?
2. The first person to run the miles in less than four minutes was ?x
在上面的示例中,1
中的查询被重新表述为 2
。正如您可能已经观察到的那样,?x
是应该由答案填充的空白。这种重新制定是通过十几个手写规则进行的,并内置在论文中讨论的软件工具中:ARANEA
。你所要做的就是找到工具并使用它,这篇论文已经有十年了,不过我不能向你保证任何事情:)
希望这对您有所帮助。
我曾经不得不解决相反的问题,即从维基百科文章的句子中生成问题。
我使用 Stanford Parser 从训练数据集中所有可能的句子中生成解析树。
例如
- 转到http://nlp.stanford.edu:8080/parser/index.jsp
- 输入"The color of the car is red."并点击"Parse"。
- 然后查看响应的解析部分。该句子的第一层是 NP VP(名词短语后跟动词短语)。
第二层是NP PP VBZ ADJP.
我基本上收集了 1000 多个句子中的这些模式,对每个模式的常见程度进行了排序,然后想出了如何最好地修改这个解析树以转换成不同 Wh 问题(什么,谁)中的每个句子、何时、何地、为什么等)
你能不能轻松地做一些非常相似的事情。研究所有训练数据的解析树,找出可以提取哪些模式来完成工作。在许多情况下,只需将问题中的 Wh 词替换为答案,就可以得到一个有效但有些笨拙的短语句子。 例如"Red is the color of the car."
对于 "Are you a man?" 这样的问题(即基本动词是 'are'、'can'、'should' 等),通常交换前两个词成功了 - "You are a man?"