维基百科的 "What links here" 计数与使用推荐工具的反向链接计数之间的差异
Disparity between Wikipedia's "What links here" count and backlink count using recommended tool
我正在尝试检索指向英语维基百科数据库页面列表的反向链接列表。我首先尝试使用 mediawiki api 收集所有链接,使用 blcontinue 参数;然而,当我查询某些页面(例如加拿大)时,会出现大量的反向链接,即很多很多。
当我查看加拿大页面的 "what links here" 并排除重定向时,似乎又出现了过多的数量(https://en.wikipedia.org/w/index.php?title=Special:WhatLinksHere/Canada&namespace=0&limit=5000&hideredirs=1). I decided that at the current time, I could just do with the total rather than the full list of links, so I used the recommended tool (https://en.wikipedia.org/wiki/Help:What_links_here#Number_of_links) and queried the api for Canada, non-redirects (the default namespace is 0), effectively replicating the above query. Here's the documentation, https://dispenser.info.tm/~dispenser/cgi-bin/backlinkscount.py,这里有一些示例 R 代码:
bl_url <- "https://dispenser.info.tm/~dispenser/cgi-bin/backlinkscount.py"
query_param <- list(
title = "Canada",
filterredir = "nonredirects")
bbl <- GET(bl_url, query = query_param)
num_bl <- as.numeric(content(bbl))
> num_bl
[1] 353
这是调用 api 生成的 url:
https://dispenser.info.tm/~dispenser/cgi-bin/backlinkscount.py?title=Canada&filterredir=nonredirects
所以返回的总数是 353,比 "what links here"
上的少很多
我是否漏掉了一些明显的东西?
没有人注意到 nonredirect
和 redirect
的逻辑被交换了多年。我取消了旧参数名称 filterredir
,创建了具有预期行为、更好的错误处理和更清晰的说明的 filter
。
我正在尝试检索指向英语维基百科数据库页面列表的反向链接列表。我首先尝试使用 mediawiki api 收集所有链接,使用 blcontinue 参数;然而,当我查询某些页面(例如加拿大)时,会出现大量的反向链接,即很多很多。
当我查看加拿大页面的 "what links here" 并排除重定向时,似乎又出现了过多的数量(https://en.wikipedia.org/w/index.php?title=Special:WhatLinksHere/Canada&namespace=0&limit=5000&hideredirs=1). I decided that at the current time, I could just do with the total rather than the full list of links, so I used the recommended tool (https://en.wikipedia.org/wiki/Help:What_links_here#Number_of_links) and queried the api for Canada, non-redirects (the default namespace is 0), effectively replicating the above query. Here's the documentation, https://dispenser.info.tm/~dispenser/cgi-bin/backlinkscount.py,这里有一些示例 R 代码:
bl_url <- "https://dispenser.info.tm/~dispenser/cgi-bin/backlinkscount.py"
query_param <- list(
title = "Canada",
filterredir = "nonredirects")
bbl <- GET(bl_url, query = query_param)
num_bl <- as.numeric(content(bbl))
> num_bl
[1] 353
这是调用 api 生成的 url:
https://dispenser.info.tm/~dispenser/cgi-bin/backlinkscount.py?title=Canada&filterredir=nonredirects
所以返回的总数是 353,比 "what links here"
上的少很多我是否漏掉了一些明显的东西?
没有人注意到 nonredirect
和 redirect
的逻辑被交换了多年。我取消了旧参数名称 filterredir
,创建了具有预期行为、更好的错误处理和更清晰的说明的 filter
。