IBM 自然语言理解 - Return 页面标题

IBM Natural Language Understanding - Return page title

我正在使用 IBM Cloud NLU 分析 URL 列表中的一系列网页。

API 成功 returning 实体,并且我能够 return 分析的内容以及使用

return_analyzed_text => 'true';

我的问题是,除了分析的文本之外,我还需要 return 网页标题。

目前我的解决方案是将每个页面分别CURL,从DOM中提取标题元素,并将分别提取的标题信息与return_analyzed_text字符串相关联。这个额外的步骤增加了相当多的过程时间,而且似乎没有必要,因为 API 显然已经在 CURL 页面上了。

有什么方法可以让 API 到 return 文档标题吗? (或任何其他 DOM 元素,如 H1?)

如果您要求 metadata - https://cloud.ibm.com/apidocs/natural-language-understanding#metadata

,您可以获得 return 标题的服务

根据文档,除了您已经传入的请求元数据之外,您还需要传入这些参数。

{
  "url": "www.ibm.com",
  "features": {
    "metadata": {}
  }
}

这将为您的 API 使用次数增加额外的单位。