绘制直方图时从 Watson Discovery Service 获取文档
Get documents from Watson Discovery Service when doing a histogram
我目前正在使用 Watson Discovery 中的直方图功能进行操作,但我需要为每个切片创建文档,以便我可以再次对它们进行处理。 (例如查看平均情绪)
这是我的查询,它将我的数据分解为 15 分钟的块
filter(enriched_tweet.concepts.text:"'Hockey'").histogram(extracted_metadata.utc_timestamp,interval:900000)
但响应只告诉我每个 "slice".
中有多少文档
{
"matching_results": 444530,
"aggregations": [
{
"type": "filter",
"match": "enriched_tweet.concepts.text:\"'Hockey'\"",
"matching_results": 69556,
"aggregations": [
{
"type": "histogram",
"field": "utc_timestamp",
"interval": 900000,
"results": [
{
"key": 1498227300000,
"matching_results": 180
},
{
"key": 1498228200000,
"matching_results": 258
},
下面答案的扩展
因此,您可以对存储桶中的数据执行操作,即使您没有在结果中看到它们,例如,以下操作将起作用:
filter(enriched_tweet.concepts.text:"'Hockey'").histogram(utc_timestamp,interval:900000).sum(followers)
我想要的是每个切片的文档数组,这样我就可以检查它们,然后对它们求和以计算出 15 分钟间隔的情绪。
您可以 运行 嵌套在直方图聚合下的总和聚合,它可以对直方图桶内的字段求和。有关聚合的更多信息,请参阅 https://www.ibm.com/watson/developercloud/doc/discovery/query-reference.html#aggregations。
我目前正在使用 Watson Discovery 中的直方图功能进行操作,但我需要为每个切片创建文档,以便我可以再次对它们进行处理。 (例如查看平均情绪)
这是我的查询,它将我的数据分解为 15 分钟的块
filter(enriched_tweet.concepts.text:"'Hockey'").histogram(extracted_metadata.utc_timestamp,interval:900000)
但响应只告诉我每个 "slice".
中有多少文档{
"matching_results": 444530,
"aggregations": [
{
"type": "filter",
"match": "enriched_tweet.concepts.text:\"'Hockey'\"",
"matching_results": 69556,
"aggregations": [
{
"type": "histogram",
"field": "utc_timestamp",
"interval": 900000,
"results": [
{
"key": 1498227300000,
"matching_results": 180
},
{
"key": 1498228200000,
"matching_results": 258
},
下面答案的扩展
因此,您可以对存储桶中的数据执行操作,即使您没有在结果中看到它们,例如,以下操作将起作用:
filter(enriched_tweet.concepts.text:"'Hockey'").histogram(utc_timestamp,interval:900000).sum(followers)
我想要的是每个切片的文档数组,这样我就可以检查它们,然后对它们求和以计算出 15 分钟间隔的情绪。
您可以 运行 嵌套在直方图聚合下的总和聚合,它可以对直方图桶内的字段求和。有关聚合的更多信息,请参阅 https://www.ibm.com/watson/developercloud/doc/discovery/query-reference.html#aggregations。