Pagerank:指向自身的节点

Pagerank: node pointing to itself

如果我想计算指向自身的节点和悬空节点的 PageRank 值,我删除悬空节点并且初始(和最终)PageRank 将为 1?

原来的 Page Rank 算法不允许自循环。然而,有一些变体要么显式添加自循环,要么考虑 link 结构中存在的自循环。

所以这里我们拥有仅包含两个节点的完整 Web(或我们抓取的 Web)。 A 有一个自循环,另一个 link 到 B。B 没有 link。这导致最终 PR 向量中的值为 0。 MMDS 书(Ullman)提出了几个选项:(1)递归地删除死角,或(2)添加税收参数。 在您的示例中,我们可以删除第二个节点。见图二。现在我们只剩下一个带有自循环的节点。请记住,已删除的节点尚未获得 0 分。比方说,如果您的实现假设一个自循环被计为一个 inlink,那么现在 A 的 PR 分数为 1。B 有一个后继者 (A) 将对其做出贡献。 A 有两个 outlink(你的循环假设,加上 link 到 B)。见图三。所以最后我们得到 B 的 PR 为 0.5

请注意,PageRanks 的总和超过 1,它们不再代表随机冲浪者的分布。然而,它们确实代表了对页面相对重要性的合理估计。 *Ullman MMDS,第 172-173 页,pdf 格式的第 9-10 页。

书籍参考:http://infolab.stanford.edu/~ullman/mmds/ch5.pdf