"Hadoop-Solr Lucidworks Project" 检索输入名称路径
"Hadoop-Solr Lucidworks Project" retrieve input name-path
我正在使用这个项目:https://github.com/lucidworks/hadoop-solr
有谁知道在哪个值中保存了正在处理的文档的名称(或路径)。我想将此值检索到 Solr Admin(将一个字段及其名称添加到我的架构中)。这可能吗?
示例:我希望能够看到文档的名称,从中查询 returns 相同的结果。
我是 运行 使用此命令的项目:
hadoop jar solr-hadoop-job-2.2.5.jar
com.lucidworks.hadoop.ingest.IngestJob
-Dlww.commit.on.close=true -DcsvDelimiter=
-cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c spyros1
- i /usr/local/hadoop/input
-of com.lucidworks.hadoop.io.LWMapRedOutputFormat
-s http://127.0.1.1:8983/solr
对于 CSVIngestMapper
,文件路径当前未添加到任何 Solr 字段。
随时在回购中创建问题。 https://github.com/lucidworks/hadoop-solr
也欢迎 PR
编辑:(请参阅 https://github.com/lucidworks/hadoop-solr/issues/16 了解解决方案)
这对我有用:
hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob
-Dlww.commit.on.close=true
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="\w+"
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=match_ss
-cls com.lucidworks.hadoop.ingest.RegexIngestMapper
-c collection1 -i /path/* -s http://127.0.1.1:8983/solr
-of com.lucidworks.hadoop.io.LWMapRedOutputFormat
另请参阅 this 了解更多信息。
我正在使用这个项目:https://github.com/lucidworks/hadoop-solr 有谁知道在哪个值中保存了正在处理的文档的名称(或路径)。我想将此值检索到 Solr Admin(将一个字段及其名称添加到我的架构中)。这可能吗?
示例:我希望能够看到文档的名称,从中查询 returns 相同的结果。
我是 运行 使用此命令的项目:
hadoop jar solr-hadoop-job-2.2.5.jar
com.lucidworks.hadoop.ingest.IngestJob
-Dlww.commit.on.close=true -DcsvDelimiter=
-cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c spyros1
- i /usr/local/hadoop/input
-of com.lucidworks.hadoop.io.LWMapRedOutputFormat
-s http://127.0.1.1:8983/solr
对于 CSVIngestMapper
,文件路径当前未添加到任何 Solr 字段。
随时在回购中创建问题。 https://github.com/lucidworks/hadoop-solr
也欢迎 PR
编辑:(请参阅 https://github.com/lucidworks/hadoop-solr/issues/16 了解解决方案)
这对我有用:
hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob
-Dlww.commit.on.close=true
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="\w+"
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=match_ss
-cls com.lucidworks.hadoop.ingest.RegexIngestMapper
-c collection1 -i /path/* -s http://127.0.1.1:8983/solr
-of com.lucidworks.hadoop.io.LWMapRedOutputFormat
另请参阅 this 了解更多信息。