概念洞察中的文本索引参数只给出了一个概念出现的实例
Text Index Parameter in concept insights gives only one instance of concept occurance
我在文档中多次提到了一个概念(例如 "Gold")。然而,概念洞察力的概念搜索将 return Gold 作为一个概念,并且只有一个该概念的文本索引(通常是第一次出现,但并非总是如此)。概念洞察的概念搜索忽略文档中其他提到的 "Gold" 是否有特定原因?我有兴趣围绕一个概念的所有出现提取文本片段。如果我能得到所有提及该概念的文本索引,那就太好了。除了在我这边进行字符串匹配之外,有什么办法可以得到它。
在此先感谢您的帮助!
Concept Insights 中的概念搜索不会忽略文档中对相同(或相关)概念的多次提及。事实上,该服务使用此信息来加强系统对每个文档中涵盖的概念区域的理解。
但是,在 "explanation" 为什么文档与文档相关的 /conceptual_search
端点 returns select 一组概念中确实如此。因为系统试图显示证明您的查询与文档之间的联系的概念的多样性,所以它可以省略重复的概念作为 "explanation" 的一部分(您可以将此 "explanation" 视为类似于传统搜索引擎可能会向用户建议文档可能相关的文本片段;它不是文档中找到的关联的完整故事)。
也就是说,您可以通过使用 /annotations 端点获取文档中提取的所有概念:GET /v2/corpora/{account_id}/{corpus}/documents/{document}/annotations
.
(文档:https://watson-api-explorer.mybluemix.net/apis/concept-insights-v2#!/corpora/getDocumentAnnotations)
对于文档中的每个注释,您都会获得概念 ID 以及文档出现在文本中的位置。因此,对于上面的示例,您可以:
1) 调用 /conceptual_search
端点以检索与您的查询相关的文档,以及一些解释概念(将文档与您的查询联系起来的概念);说你发现这个概念是问题是 Gold
.
2) 为返回的文档调用 /{document}/annotations
,在 selected 文档中查找 "explanation concepts" (Gold
) 的其他出现。您应该能够构建涵盖整个文档的 Gold
次出现的列表(以及其他解释概念的列表)。
我在文档中多次提到了一个概念(例如 "Gold")。然而,概念洞察力的概念搜索将 return Gold 作为一个概念,并且只有一个该概念的文本索引(通常是第一次出现,但并非总是如此)。概念洞察的概念搜索忽略文档中其他提到的 "Gold" 是否有特定原因?我有兴趣围绕一个概念的所有出现提取文本片段。如果我能得到所有提及该概念的文本索引,那就太好了。除了在我这边进行字符串匹配之外,有什么办法可以得到它。
在此先感谢您的帮助!
Concept Insights 中的概念搜索不会忽略文档中对相同(或相关)概念的多次提及。事实上,该服务使用此信息来加强系统对每个文档中涵盖的概念区域的理解。
但是,在 "explanation" 为什么文档与文档相关的 /conceptual_search
端点 returns select 一组概念中确实如此。因为系统试图显示证明您的查询与文档之间的联系的概念的多样性,所以它可以省略重复的概念作为 "explanation" 的一部分(您可以将此 "explanation" 视为类似于传统搜索引擎可能会向用户建议文档可能相关的文本片段;它不是文档中找到的关联的完整故事)。
也就是说,您可以通过使用 /annotations 端点获取文档中提取的所有概念:GET /v2/corpora/{account_id}/{corpus}/documents/{document}/annotations
.
(文档:https://watson-api-explorer.mybluemix.net/apis/concept-insights-v2#!/corpora/getDocumentAnnotations)
对于文档中的每个注释,您都会获得概念 ID 以及文档出现在文本中的位置。因此,对于上面的示例,您可以:
1) 调用 /conceptual_search
端点以检索与您的查询相关的文档,以及一些解释概念(将文档与您的查询联系起来的概念);说你发现这个概念是问题是 Gold
.
2) 为返回的文档调用 /{document}/annotations
,在 selected 文档中查找 "explanation concepts" (Gold
) 的其他出现。您应该能够构建涵盖整个文档的 Gold
次出现的列表(以及其他解释概念的列表)。