google 爬虫如何找到互联网上的每个页面

How google crawler find each and every page over the internet

今天我有一个问题,google 爬虫如何在抓取过程中找到互联网上的每一页,如果您有答案,请与我分享。

如果您需要更多信息,请查看以下内容link。

HOW SEARCH WORKS

提前致谢!!!!

恰好抓取是存储缓存数据的过程,搜索引擎在缓存数据中寻找超链接,可能是文本超链接也可能是图片超链接。然后在找到一个之后,它会打开该页面进行缓存并开始在其中查找链接。该过程一直持续到找不到更多链接为止。

所以,在这长长的超链接链中,几乎可以肯定的是,互联网的大部分内容都包含在内。但是,这并不意味着它已经抓取了所有内容。 由于缺少指向它的链接,许多新网站被排除在外。 还有一些网站未被抓取,因为它们不打算被发现。