叶组的预期数量是冗余的一个因素,但它不是
Expected number of leaf groups to be a factor of redundancy, but it is not
我正在尝试部署一个包含 10 台物理机的 Vespa 集群,每台包含 5 个内容节点。冗余设置为 2,我不希望数据及其副本位于同一台物理机器上。因此,我在代表它们所在的物理机器的内容节点上创建了组,并将重新分区策略设置为:1|*
.
这是我的群组配置:
<group name="top-group" distribution-key="0">
<distribution partitions="1|*"/>
<group name="machine1" distribution-key="1">
<node hostalias="content11" distribution-key="11"/>
<node hostalias="content12" distribution-key="12"/>
<node hostalias="content13" distribution-key="13"/>
<node hostalias="content14" distribution-key="14"/>
<node hostalias="content15" distribution-key="15"/>
</group>
<group name="machine2" distribution-key="2">
<node hostalias="content21" distribution-key="21"/>
<node hostalias="content22" distribution-key="22"/>
<node hostalias="content23" distribution-key="23"/>
<node hostalias="content24" distribution-key="24"/>
<node hostalias="content25" distribution-key="25"/>
</group>
<group name="machine3" distribution-key="3">
<node hostalias="content31" distribution-key="31"/>
<node hostalias="content32" distribution-key="32"/>
<node hostalias="content33" distribution-key="33"/>
<node hostalias="content34" distribution-key="34"/>
<node hostalias="content35" distribution-key="35"/>
</group>
<group name="machine4" distribution-key="4">
<node hostalias="content41" distribution-key="41"/>
<node hostalias="content42" distribution-key="42"/>
<node hostalias="content43" distribution-key="43"/>
<node hostalias="content44" distribution-key="44"/>
<node hostalias="content45" distribution-key="45"/>
</group>
<group name="machine5" distribution-key="5">
<node hostalias="content51" distribution-key="51"/>
<node hostalias="content52" distribution-key="52"/>
<node hostalias="content53" distribution-key="53"/>
<node hostalias="content54" distribution-key="54"/>
<node hostalias="content55" distribution-key="55"/>
</group>
<group name="machine6" distribution-key="6">
<node hostalias="content61" distribution-key="61"/>
<node hostalias="content62" distribution-key="62"/>
<node hostalias="content63" distribution-key="63"/>
<node hostalias="content64" distribution-key="64"/>
<node hostalias="content65" distribution-key="65"/>
</group>
<group name="machine7" distribution-key="7">
<node hostalias="content71" distribution-key="71"/>
<node hostalias="content72" distribution-key="72"/>
<node hostalias="content73" distribution-key="73"/>
<node hostalias="content74" distribution-key="74"/>
<node hostalias="content75" distribution-key="75"/>
</group>
<group name="machine8" distribution-key="8">
<node hostalias="content81" distribution-key="81"/>
<node hostalias="content82" distribution-key="82"/>
<node hostalias="content83" distribution-key="83"/>
<node hostalias="content84" distribution-key="84"/>
<node hostalias="content85" distribution-key="85"/>
</group>
<group name="machine9" distribution-key="9">
<node hostalias="content91" distribution-key="91"/>
<node hostalias="content92" distribution-key="92"/>
<node hostalias="content93" distribution-key="93"/>
<node hostalias="content94" distribution-key="94"/>
<node hostalias="content95" distribution-key="95"/>
</group>
<group name="machine10" distribution-key="10">
<node hostalias="content101" distribution-key="101"/>
<node hostalias="content102" distribution-key="102"/>
<node hostalias="content103" distribution-key="103"/>
<node hostalias="content104" distribution-key="104"/>
<node hostalias="content105" distribution-key="105"/>
</group>
</group>
当我尝试部署我的应用程序时,我遇到了这个错误:
Request failed. HTTP status code: 400
Invalid application package: default.default: Error loading model: In indexed content cluster 'site' using hierarchic distribution: Expected number of leaf groups (10) to be a factor of redundancy (2), but it is not.
我不明白。我应该在我的配置中更改什么来解决这个问题?
关于 Document Distribution is missing an important limitation. The use-case you describe is not supported for the mode="index"
, only for mode="streaming"
(Streaming Search) 和 mode="store-only"
的文档。
使用 mode="index"
时,搜索将被路由到一个组,从而提高吞吐量。这意味着每个组中的每个文档都必须有一份副本。
对于 10 台物理机器,您必须在每台机器上都有一个内容实例,以确保副本存储在不同的机器上。这意味着您不应在每台物理机上使用分层分布和多个内容实例。
我正在尝试部署一个包含 10 台物理机的 Vespa 集群,每台包含 5 个内容节点。冗余设置为 2,我不希望数据及其副本位于同一台物理机器上。因此,我在代表它们所在的物理机器的内容节点上创建了组,并将重新分区策略设置为:1|*
.
这是我的群组配置:
<group name="top-group" distribution-key="0">
<distribution partitions="1|*"/>
<group name="machine1" distribution-key="1">
<node hostalias="content11" distribution-key="11"/>
<node hostalias="content12" distribution-key="12"/>
<node hostalias="content13" distribution-key="13"/>
<node hostalias="content14" distribution-key="14"/>
<node hostalias="content15" distribution-key="15"/>
</group>
<group name="machine2" distribution-key="2">
<node hostalias="content21" distribution-key="21"/>
<node hostalias="content22" distribution-key="22"/>
<node hostalias="content23" distribution-key="23"/>
<node hostalias="content24" distribution-key="24"/>
<node hostalias="content25" distribution-key="25"/>
</group>
<group name="machine3" distribution-key="3">
<node hostalias="content31" distribution-key="31"/>
<node hostalias="content32" distribution-key="32"/>
<node hostalias="content33" distribution-key="33"/>
<node hostalias="content34" distribution-key="34"/>
<node hostalias="content35" distribution-key="35"/>
</group>
<group name="machine4" distribution-key="4">
<node hostalias="content41" distribution-key="41"/>
<node hostalias="content42" distribution-key="42"/>
<node hostalias="content43" distribution-key="43"/>
<node hostalias="content44" distribution-key="44"/>
<node hostalias="content45" distribution-key="45"/>
</group>
<group name="machine5" distribution-key="5">
<node hostalias="content51" distribution-key="51"/>
<node hostalias="content52" distribution-key="52"/>
<node hostalias="content53" distribution-key="53"/>
<node hostalias="content54" distribution-key="54"/>
<node hostalias="content55" distribution-key="55"/>
</group>
<group name="machine6" distribution-key="6">
<node hostalias="content61" distribution-key="61"/>
<node hostalias="content62" distribution-key="62"/>
<node hostalias="content63" distribution-key="63"/>
<node hostalias="content64" distribution-key="64"/>
<node hostalias="content65" distribution-key="65"/>
</group>
<group name="machine7" distribution-key="7">
<node hostalias="content71" distribution-key="71"/>
<node hostalias="content72" distribution-key="72"/>
<node hostalias="content73" distribution-key="73"/>
<node hostalias="content74" distribution-key="74"/>
<node hostalias="content75" distribution-key="75"/>
</group>
<group name="machine8" distribution-key="8">
<node hostalias="content81" distribution-key="81"/>
<node hostalias="content82" distribution-key="82"/>
<node hostalias="content83" distribution-key="83"/>
<node hostalias="content84" distribution-key="84"/>
<node hostalias="content85" distribution-key="85"/>
</group>
<group name="machine9" distribution-key="9">
<node hostalias="content91" distribution-key="91"/>
<node hostalias="content92" distribution-key="92"/>
<node hostalias="content93" distribution-key="93"/>
<node hostalias="content94" distribution-key="94"/>
<node hostalias="content95" distribution-key="95"/>
</group>
<group name="machine10" distribution-key="10">
<node hostalias="content101" distribution-key="101"/>
<node hostalias="content102" distribution-key="102"/>
<node hostalias="content103" distribution-key="103"/>
<node hostalias="content104" distribution-key="104"/>
<node hostalias="content105" distribution-key="105"/>
</group>
</group>
当我尝试部署我的应用程序时,我遇到了这个错误:
Request failed. HTTP status code: 400
Invalid application package: default.default: Error loading model: In indexed content cluster 'site' using hierarchic distribution: Expected number of leaf groups (10) to be a factor of redundancy (2), but it is not.
我不明白。我应该在我的配置中更改什么来解决这个问题?
关于 Document Distribution is missing an important limitation. The use-case you describe is not supported for the mode="index"
, only for mode="streaming"
(Streaming Search) 和 mode="store-only"
的文档。
使用 mode="index"
时,搜索将被路由到一个组,从而提高吞吐量。这意味着每个组中的每个文档都必须有一份副本。
对于 10 台物理机器,您必须在每台机器上都有一个内容实例,以确保副本存储在不同的机器上。这意味着您不应在每台物理机上使用分层分布和多个内容实例。