为什么一个磁盘块不能存储多个索引树节点
Why can't a disk block store multiple index tree nodes
最近在研究索引树在数据库中的实现,了解到使用B+tree可以在一个磁盘块中存储尽可能多的key,使得查找过程能够读取尽可能少的磁盘。
但是我有一个疑问,为什么一个磁盘块不能存储多个索引树节点?每个节点的指针可以设计为blockNumber + offset
.
一个磁盘块当然可以存储多个索引树节点。您需要做的就是定义您想要的任何块大小,文件系统将其映射到正确的物理块。
通常你不想这样做,但主要是出于性能原因。随着时间的推移,树节点往往会散落在各处,然后将它们加载回去最终会加载一个完整的物理块。块中的其余节点可能不需要,但您支付的加载成本超过了您的需要。为了分摊成本,将节点大小与块大小相匹配是个好主意。这有助于降低执行索引扫描的成本,因为无论如何您最终都会读取整个节点。
如果以纯随机方式访问索引,并且条目相对较小,那么节点大小是否小于物理块大小并不重要。但是数据库的目标是通用的,他们并不真正事先知道索引最终将如何使用。将节点大小与物理块大小相匹配是一个安全的选择。
最近在研究索引树在数据库中的实现,了解到使用B+tree可以在一个磁盘块中存储尽可能多的key,使得查找过程能够读取尽可能少的磁盘。
但是我有一个疑问,为什么一个磁盘块不能存储多个索引树节点?每个节点的指针可以设计为blockNumber + offset
.
一个磁盘块当然可以存储多个索引树节点。您需要做的就是定义您想要的任何块大小,文件系统将其映射到正确的物理块。
通常你不想这样做,但主要是出于性能原因。随着时间的推移,树节点往往会散落在各处,然后将它们加载回去最终会加载一个完整的物理块。块中的其余节点可能不需要,但您支付的加载成本超过了您的需要。为了分摊成本,将节点大小与块大小相匹配是个好主意。这有助于降低执行索引扫描的成本,因为无论如何您最终都会读取整个节点。
如果以纯随机方式访问索引,并且条目相对较小,那么节点大小是否小于物理块大小并不重要。但是数据库的目标是通用的,他们并不真正事先知道索引最终将如何使用。将节点大小与物理块大小相匹配是一个安全的选择。