IBM 自然语言理解 - Return 页面标题
IBM Natural Language Understanding - Return page title
我正在使用 IBM Cloud NLU 分析 URL 列表中的一系列网页。
API 成功 returning 实体,并且我能够 return 分析的内容以及使用
return_analyzed_text => 'true';
我的问题是,除了分析的文本之外,我还需要 return 网页标题。
目前我的解决方案是将每个页面分别CURL,从DOM中提取标题元素,并将分别提取的标题信息与return_analyzed_text字符串相关联。这个额外的步骤增加了相当多的过程时间,而且似乎没有必要,因为 API 显然已经在 CURL 页面上了。
有什么方法可以让 API 到 return 文档标题吗? (或任何其他 DOM 元素,如 H1?)
如果您要求 metadata
- https://cloud.ibm.com/apidocs/natural-language-understanding#metadata
,您可以获得 return 标题的服务
根据文档,除了您已经传入的请求元数据之外,您还需要传入这些参数。
{
"url": "www.ibm.com",
"features": {
"metadata": {}
}
}
这将为您的 API 使用次数增加额外的单位。
我正在使用 IBM Cloud NLU 分析 URL 列表中的一系列网页。
API 成功 returning 实体,并且我能够 return 分析的内容以及使用
return_analyzed_text => 'true';
我的问题是,除了分析的文本之外,我还需要 return 网页标题。
目前我的解决方案是将每个页面分别CURL,从DOM中提取标题元素,并将分别提取的标题信息与return_analyzed_text字符串相关联。这个额外的步骤增加了相当多的过程时间,而且似乎没有必要,因为 API 显然已经在 CURL 页面上了。
有什么方法可以让 API 到 return 文档标题吗? (或任何其他 DOM 元素,如 H1?)
如果您要求 metadata
- https://cloud.ibm.com/apidocs/natural-language-understanding#metadata
根据文档,除了您已经传入的请求元数据之外,您还需要传入这些参数。
{
"url": "www.ibm.com",
"features": {
"metadata": {}
}
}
这将为您的 API 使用次数增加额外的单位。