以更结构化的方式从 mediawiki 检索信息
Retrieve information from a mediawiki in a more structured way
我们想使用自托管 mediawiki 作为轻量级 CMS 从中检索信息。然而,基本的 REST API 在检索内容的方式上非常有限:这可能是因为 wiki 上的大多数信息都是非结构化形式。
- 是否可以将您自己的 ID 系统添加到 mediawiki,这样您就可以搜索特定的 ID(或者甚至以类似 REST 的方式通过 ID 请求内容),而不是获取整个页面或部分的信息? 例如
/:heading/:subheading/:sub-subheading
?
- 或者,如果没有,至少有一种添加您自己的 ID 的方法,以便您可以以更有条理的方式解析某个部分中的信息?
通过使用解决:
- 默认 REST API,使用 npm 包 nodemw 进行了简化。
- 使用 npm 包 instaview 将 wiki/text 解析为 HTML。
- 使用 npm 包 cheerio 访问/修改 HTML 服务器端。
免费的非结构化文本 BLOB 万岁!去维基媒体去!天啊
我们想使用自托管 mediawiki 作为轻量级 CMS 从中检索信息。然而,基本的 REST API 在检索内容的方式上非常有限:这可能是因为 wiki 上的大多数信息都是非结构化形式。
- 是否可以将您自己的 ID 系统添加到 mediawiki,这样您就可以搜索特定的 ID(或者甚至以类似 REST 的方式通过 ID 请求内容),而不是获取整个页面或部分的信息? 例如
/:heading/:subheading/:sub-subheading
? - 或者,如果没有,至少有一种添加您自己的 ID 的方法,以便您可以以更有条理的方式解析某个部分中的信息?
通过使用解决: - 默认 REST API,使用 npm 包 nodemw 进行了简化。 - 使用 npm 包 instaview 将 wiki/text 解析为 HTML。 - 使用 npm 包 cheerio 访问/修改 HTML 服务器端。
免费的非结构化文本 BLOB 万岁!去维基媒体去!天啊