获取 Common Crawl 首次抓取 URL 的日期?
Getting date of first crawl of URL by Common Crawl?
在 Common Crawl 中,相同的 URL 可以多次收获。
例如,Reddit 博客 post 可以在创建时被抓取,然后在添加后续评论时被抓取。
有没有办法找到给定 URL 首次被 Common Crawl 抓取的时间?
在 Common Crawl 中,相同的 URL 可以多次收获。
例如,Reddit 博客 post 可以在创建时被抓取,然后在添加后续评论时被抓取。
有没有办法找到给定 URL 首次被 Common Crawl 抓取的时间?