Nutch 1.6 不搜索 seed.txt 中的新条目

Nutch 1.6 doesn't search new entries in seed.txt

我设置了 Solr 7.7.1 和 Nutch 1.6 以及 运行 测试搜索。为此,我在 seed.txt 中放置了一个 URL 并且一切正常。在这个测试之后,我删除了Solr中的旧内核,创建了一个新内核并将多个URL放入seed.txt,然后再次启动Nutch进行新的爬取。但是我在每次尝试中都得到了之前测试的结果运行。我怎样才能删除以前的搜索并启动 Nutch 来抓取我放入 seed.txt?

的新 URLs

提前感谢您的回答。

您应该删除 crawl/ 目录(如果它名为 crawl)。此目录包含以前爬取的数据(在发送到 Solr 之前)。可能在您 运行 爬网命令和 Nutch 正在将已存储的数据发送到 Solr 之后没有新内容。