字段类型字符串与字符串
Fieldtype string vs strings
我对可用的字段类型有些困惑。 string
vs strings
和 int
vs ints
等其他数据类型。
以下4个有什么区别?
<field name="string_multi" type="string" multiValued="true" indexed="true" stored="true"/>
<field name="string_single" type="string" indexed="true" stored="true"/>
<field name="strings_multi" type="strings" multiValued="true" indexed="true" stored="true"/>
<field name="strings_single" type="strings" indexed="true" stored="true"/>
鉴于我有文件,我应该为名为 hashtags
的字段声明什么?
String multivalued
或 strings multivalue
或 strings without multivalue
, ?
{
"polarity":0.0,
"text":"RT @socialistudents: Vlad - we go to NUS conference not just as individuals but as members of Socialist Students #SocStu17",
"created_at":"Sun Feb 12 19:28:34 +0000 2017",
"hashtags":[
"hashtag1",
"hashtag2"
],
"subjectivity":0.0,
"retweet_recount":4,
"id":830861171582439424,
"favorite_count":0
}
好吧,如果您谈论的是在使用 Solr 的默认模式时创建的默认字段类型,如果您实际查看 fieldType 定义,它是这样说的:
<fieldType name="string" class="solr.StrField" sortMissingLast="true" docValues="true" />
<fieldType name="strings" class="solr.StrField" sortMissingLast="true" multiValued="true" docValues="true" />
已编辑:第二个例子应该是strings
而不是string
所以他们实际上有相同的class(solr默认的字符串classsolr.StrField
)所以他们是同一类型的数据。唯一的区别是 'strings' 是多值的,这意味着您可以在一个字段中存储多个离散值。
在您的示例中,您的主题标签数据似乎只是单个主题标签值的数组,因此由于您想在一个字段中存储多个离散字符串,因此 'strings' 是多值的选择.
我对可用的字段类型有些困惑。 string
vs strings
和 int
vs ints
等其他数据类型。
以下4个有什么区别?
<field name="string_multi" type="string" multiValued="true" indexed="true" stored="true"/>
<field name="string_single" type="string" indexed="true" stored="true"/>
<field name="strings_multi" type="strings" multiValued="true" indexed="true" stored="true"/>
<field name="strings_single" type="strings" indexed="true" stored="true"/>
鉴于我有文件,我应该为名为 hashtags
的字段声明什么?
String multivalued
或 strings multivalue
或 strings without multivalue
, ?
{
"polarity":0.0,
"text":"RT @socialistudents: Vlad - we go to NUS conference not just as individuals but as members of Socialist Students #SocStu17",
"created_at":"Sun Feb 12 19:28:34 +0000 2017",
"hashtags":[
"hashtag1",
"hashtag2"
],
"subjectivity":0.0,
"retweet_recount":4,
"id":830861171582439424,
"favorite_count":0
}
好吧,如果您谈论的是在使用 Solr 的默认模式时创建的默认字段类型,如果您实际查看 fieldType 定义,它是这样说的:
<fieldType name="string" class="solr.StrField" sortMissingLast="true" docValues="true" />
<fieldType name="strings" class="solr.StrField" sortMissingLast="true" multiValued="true" docValues="true" />
已编辑:第二个例子应该是strings
而不是string
所以他们实际上有相同的class(solr默认的字符串classsolr.StrField
)所以他们是同一类型的数据。唯一的区别是 'strings' 是多值的,这意味着您可以在一个字段中存储多个离散值。
在您的示例中,您的主题标签数据似乎只是单个主题标签值的数组,因此由于您想在一个字段中存储多个离散字符串,因此 'strings' 是多值的选择.