如何为 nutch 配置 mongoDB?

how can I configure mongoDB for nutch?

最近想做一个web-spider,我用的是nutch-1.10,想加载数据到mongoDB,数据是nutch/crawl,不知道怎么配置mongoDBnutch,找不到相关资料。我从一些博客知道nutch2.x是必须的,而1.x不能达到我的目的!但是我还不清楚配置的细节!有人可以清楚吗!谢谢!

Nutch 2.x 对 MongoDB 的支持不是用于存储提取和结构化结果,而是将 nutch 的内部数据库存储在 MongoDB.

目前nutch支持推送数据到Apache Solr、Elasticsearch和Amazon Cloud service。如果要将数据推送到 MongoDB,则需要创建一个新的索引器插件。查看 indexer-elasticindexer-solr 以了解如何编写新的索引器插件。