Pagerank：指向自身的节点

Pagerank: node pointing to itself

如果我想计算指向自身的节点和悬空节点的 PageRank 值，我删除悬空节点并且初始（和最终）PageRank 将为 1？

原来的 Page Rank 算法不允许自循环。然而，有一些变体要么显式添加自循环，要么考虑 link 结构中存在的自循环。

所以这里我们拥有仅包含两个节点的完整 Web（或我们抓取的 Web）。 A 有一个自循环，另一个 link 到 B。B 没有 link。这导致最终 PR 向量中的值为 0。 MMDS 书（Ullman）提出了几个选项：（1）递归地删除死角，或（2）添加税收参数。在您的示例中，我们可以删除第二个节点。见图二。现在我们只剩下一个带有自循环的节点。请记住，已删除的节点尚未获得 0 分。比方说，如果您的实现假设一个自循环被计为一个 inlink，那么现在 A 的 PR 分数为 1。B 有一个后继者 (A) 将对其做出贡献。 A 有两个 outlink（你的循环假设，加上 link 到 B）。见图三。所以最后我们得到 B 的 PR 为 0.5

请注意，PageRanks 的总和超过 1，它们不再代表随机冲浪者的分布。然而，它们确实代表了对页面相对重要性的合理估计。 *Ullman MMDS，第 172-173 页，pdf 格式的第 9-10 页。

书籍参考：http://infolab.stanford.edu/~ullman/mmds/ch5.pdf

Pagerank：指向自身的节点

Pagerank: node pointing to itself

pagerank

web-search

web