bin/nutch 注入 crawl/crawldb 网址无效
bin/nutch inject crawl/crawldb urls not working
我刚刚按照教程从 NutchWiki.
设置了 Nutch
已下载 Nutch 2.x src 并设置所有配置。
问题出现在我刚开始爬取的时候。
当我 运行 此代码时:bin/nutch inject crawl/crawldb urls
我收到这样的错误消息:Unrecognized arg urls
我只是按照教程中的所有步骤,创建目录,更改配置文件等。而且我还有一个问题,即 apache-nutch-2 中没有 crawdb 目录。x/runtime/local/ 是自动生成的还是需要手动生成吗?
对此问题的任何帮助将不胜感激。
我遇到了同样的问题。该文档似乎已过时。它适用于 1.x .
对于2.x,我尝试了以下方法并且对我有用。
bin/nutch inject urls
希望对您有所帮助。
我刚刚按照教程从 NutchWiki.
设置了 Nutch已下载 Nutch 2.x src 并设置所有配置。
问题出现在我刚开始爬取的时候。
当我 运行 此代码时:bin/nutch inject crawl/crawldb urls
我收到这样的错误消息:Unrecognized arg urls
我只是按照教程中的所有步骤,创建目录,更改配置文件等。而且我还有一个问题,即 apache-nutch-2 中没有 crawdb 目录。x/runtime/local/ 是自动生成的还是需要手动生成吗?
对此问题的任何帮助将不胜感激。
我遇到了同样的问题。该文档似乎已过时。它适用于 1.x .
对于2.x,我尝试了以下方法并且对我有用。
bin/nutch inject urls
希望对您有所帮助。