Solr 6 高亮不显示内容或_text_
Solr 6 highlighting does not show content or _text_
我有一个 solr 6.6.0 实例 运行 并且已经索引了一些文档 - PDF 和 HTML。以前我有 solr 4 并且使用突出显示的结果进行搜索很好。
不幸的是,这种(默认)行为似乎在 v6 中消失了。该设置是原始 solr 教程中提到的默认设置。
我尝试了很多 GET 参数,但无法获取突出显示的内容。
感谢任何提示或提示来获得此 运行。我是否遗漏了一些配置更改或参数?
例如
http://serv1:8983/solr/gettingstarted/select?wt=json&indent=true&q=betreten&hl=true&hl.method=unified
给予
{
"responseHeader":{
"zkConnected":true,
"status":0,
"QTime":152,
"params":{
"q":"betreten",
"hl":"true",
"indent":"true",
"hl.method":"unified",
"wt":"json"}},
"response":{"numFound":1,"start":0,"maxScore":0.822483,"docs":[
{
"id":"/var/docs/2017/08/22/2319/page-1.html",
"stream_size":[3820],
"x_parsed_by":["org.apache.tika.parser.DefaultParser",
"org.apache.tika.parser.html.HtmlParser"],
"stream_content_type":["text/html"],
"dc_title":["/var/docs/2017/08/22/2319/page-1.html (22.08.2017 23:19)"],
"ocr_system":["tesseract 3.04.01"],
"content_encoding":["UTF-8"],
"content_type_hint":["text/html; charset=utf-8"],
"resourcename":["/var/docs/2017/08/22/2319/page-1.html"],
"title":["/var/docs/2017/08/22/2319/page-1.html (22.08.2017 23:19)"],
"content_type":["application/xhtml+xml; charset=UTF-8"],
"ocr_capabilities":["ocr_page ocr_carea ocr_par ocr_line ocrx_word"],
"_version_":1576604407523442688}]
},
"highlighting":{
"/var/docs/2017/08/22/2319/page-1.html":{
"_text_":[]}}}
谢谢!
荧光笔一般分析stored text 为了突出显示。
在您的架构中,请检查是否存储了 _text_
。如果它是托管架构,则可能不会存储 _text_
。请检查托管架构中的以下 _text_
配置或 schema.xml
<field name="_text_" type="text_general" multiValued="true" indexed="true" stored="false"/>
stored=false
表示不存储_text_
的内容。如果您设置 stored="true"
,那么 _text_
将被存储并可用于突出显示。
注意:
更改 schema.xml 或托管架构文件后,
- 您需要重启 Solr 实例以使更改生效
- 需要重新加载数据
我有一个 solr 6.6.0 实例 运行 并且已经索引了一些文档 - PDF 和 HTML。以前我有 solr 4 并且使用突出显示的结果进行搜索很好。 不幸的是,这种(默认)行为似乎在 v6 中消失了。该设置是原始 solr 教程中提到的默认设置。 我尝试了很多 GET 参数,但无法获取突出显示的内容。 感谢任何提示或提示来获得此 运行。我是否遗漏了一些配置更改或参数?
例如
http://serv1:8983/solr/gettingstarted/select?wt=json&indent=true&q=betreten&hl=true&hl.method=unified
给予
{
"responseHeader":{
"zkConnected":true,
"status":0,
"QTime":152,
"params":{
"q":"betreten",
"hl":"true",
"indent":"true",
"hl.method":"unified",
"wt":"json"}},
"response":{"numFound":1,"start":0,"maxScore":0.822483,"docs":[
{
"id":"/var/docs/2017/08/22/2319/page-1.html",
"stream_size":[3820],
"x_parsed_by":["org.apache.tika.parser.DefaultParser",
"org.apache.tika.parser.html.HtmlParser"],
"stream_content_type":["text/html"],
"dc_title":["/var/docs/2017/08/22/2319/page-1.html (22.08.2017 23:19)"],
"ocr_system":["tesseract 3.04.01"],
"content_encoding":["UTF-8"],
"content_type_hint":["text/html; charset=utf-8"],
"resourcename":["/var/docs/2017/08/22/2319/page-1.html"],
"title":["/var/docs/2017/08/22/2319/page-1.html (22.08.2017 23:19)"],
"content_type":["application/xhtml+xml; charset=UTF-8"],
"ocr_capabilities":["ocr_page ocr_carea ocr_par ocr_line ocrx_word"],
"_version_":1576604407523442688}]
},
"highlighting":{
"/var/docs/2017/08/22/2319/page-1.html":{
"_text_":[]}}}
谢谢!
荧光笔一般分析stored text 为了突出显示。
在您的架构中,请检查是否存储了 _text_
。如果它是托管架构,则可能不会存储 _text_
。请检查托管架构中的以下 _text_
配置或 schema.xml
<field name="_text_" type="text_general" multiValued="true" indexed="true" stored="false"/>
stored=false
表示不存储_text_
的内容。如果您设置 stored="true"
,那么 _text_
将被存储并可用于突出显示。
注意: 更改 schema.xml 或托管架构文件后,
- 您需要重启 Solr 实例以使更改生效
- 需要重新加载数据