IBM 自然语言理解 - Return 页面标题

Question

我正在使用 IBM Cloud NLU 分析 URL 列表中的一系列网页。

API 成功 returning 实体，并且我能够 return 分析的内容以及使用

return_analyzed_text => 'true';

我的问题是，除了分析的文本之外，我还需要 return 网页标题。

目前我的解决方案是将每个页面分别CURL，从DOM中提取标题元素，并将分别提取的标题信息与return_analyzed_text字符串相关联。这个额外的步骤增加了相当多的过程时间，而且似乎没有必要，因为 API 显然已经在 CURL 页面上了。

有什么方法可以让 API 到 return 文档标题吗？（或任何其他 DOM 元素，如 H1？）

Answer 1

，您可以获得 return 标题的服务

根据文档，除了您已经传入的请求元数据之外，您还需要传入这些参数。

{
  "url": "www.ibm.com",
  "features": {
    "metadata": {}
  }
}

这将为您的 API 使用次数增加额外的单位。

IBM Natural Language Understanding - Return page title