bin/nutch 注入 crawl/crawldb 网址无效

bin/nutch inject crawl/crawldb urls not working

我刚刚按照教程从 NutchWiki.

设置了 Nutch

已下载 Nutch 2.x src 并设置所有配置。 问题出现在我刚开始爬取的时候。 当我 运行 此代码时:bin/nutch inject crawl/crawldb urls 我收到这样的错误消息:Unrecognized arg urls 我只是按照教程中的所有步骤,创建目录,更改配置文件等。而且我还有一个问题,即 apache-nutch-2 中没有 crawdb 目录。x/runtime/local/ 是自动生成的还是需要手动生成吗? 对此问题的任何帮助将不胜感激。

我遇到了同样的问题。该文档似乎已过时。它适用于 1.x .

对于2.x,我尝试了以下方法并且对我有用。

bin/nutch inject urls

希望对您有所帮助。