维基百科的 "What links here" 计数与使用推荐工具的反向链接计数之间的差异

Disparity between Wikipedia's "What links here" count and backlink count using recommended tool

我正在尝试检索指向英语维基百科数据库页面列表的反向链接列表。我首先尝试使用 mediawiki api 收集所有链接,使用 blcontinue 参数;然而,当我查询某些页面(例如加拿大)时,会出现大量的反向链接,即很多很多。

当我查看加拿大页面的 "what links here" 并排除重定向时,似乎又出现了过多的数量(https://en.wikipedia.org/w/index.php?title=Special:WhatLinksHere/Canada&namespace=0&limit=5000&hideredirs=1). I decided that at the current time, I could just do with the total rather than the full list of links, so I used the recommended tool (https://en.wikipedia.org/wiki/Help:What_links_here#Number_of_links) and queried the api for Canada, non-redirects (the default namespace is 0), effectively replicating the above query. Here's the documentation, https://dispenser.info.tm/~dispenser/cgi-bin/backlinkscount.py,这里有一些示例 R 代码:

bl_url <- "https://dispenser.info.tm/~dispenser/cgi-bin/backlinkscount.py"
  query_param <- list(
  title  = "Canada",
  filterredir = "nonredirects")

bbl <- GET(bl_url, query = query_param)

num_bl <- as.numeric(content(bbl))

> num_bl
[1] 353

这是调用 api 生成的 url:

https://dispenser.info.tm/~dispenser/cgi-bin/backlinkscount.py?title=Canada&filterredir=nonredirects

所以返回的总数是 353,比 "what links here"

上的少很多

我是否漏掉了一些明显的东西?

没有人注意到 nonredirectredirect 的逻辑被交换了多年。我取消了旧参数名称 filterredir,创建了具有预期行为、更好的错误处理和更清晰的说明的 filter

https://dispenser.info.tm/~dispenser/cgi-bin/backlinkscount.py?title=Canada&filter=nonredirects&from_namespaces=0