google 爬虫如何找到互联网上的每个页面

How google crawler find each and every page over the internet

今天我有一个问题，google 爬虫如何在抓取过程中找到互联网上的每一页，如果您有答案，请与我分享。

如果您需要更多信息，请查看以下内容link。

提前致谢!!!!

恰好抓取是存储缓存数据的过程，搜索引擎在缓存数据中寻找超链接，可能是文本超链接也可能是图片超链接。然后在找到一个之后，它会打开该页面进行缓存并开始在其中查找链接。该过程一直持续到找不到更多链接为止。

所以，在这长长的超链接链中，几乎可以肯定的是，互联网的大部分内容都包含在内。但是，这并不意味着它已经抓取了所有内容。由于缺少指向它的链接，许多新网站被排除在外。还有一些网站未被抓取，因为它们不打算被发现。