Apache Nutch - Solr Clean 与 deleteGone
Apache Nutch - Solr Clean vs deleteGone
我使用 Apache Nutch 进行爬网,使用 Solr 进行索引。
我的问题是:使用 bin/nutch clean
和在 bin/nutch index
中使用标志 -deleteGone
有什么区别?
这两种方式具有相同的效果 - 从 Solr 索引(或其他索引,例如 Elasticsearch)中删除所有 404、重定向等。
我使用 Apache Nutch 进行爬网,使用 Solr 进行索引。
我的问题是:使用 bin/nutch clean
和在 bin/nutch index
中使用标志 -deleteGone
有什么区别?
这两种方式具有相同的效果 - 从 Solr 索引(或其他索引,例如 Elasticsearch)中删除所有 404、重定向等。