常见的几种数据结构
1、二叉树
特点:
- 每个节点最多有两个子节点,分别称为左子节点和右子节点。
- 通常不是自平衡的,可能会出现极端倾斜的情况,导致插入和删除的时间复杂度变为 O(n)。
2、红黑树
红黑树又称平衡二叉树
特点:
- 每个节点要么是红色,要么是黑色。
- 根节点是黑色的。
- 没有连续的红色节点(即红色节点的父节点和子节点不能同时为红色)。
- 对于每个节点,从该节点到其子孙节点的所有路径上包含相同数目的黑色节点。
- 新插入的节点为红色,然后通过颜色调整和旋转来满足上述性质。
通过保持特定的平衡条件,可以在插入和删除节点时自我调整,保持树的平衡性,确保操作的时间复杂度为 O(log n)。
红黑树常被用作 C++ STL 中的 map 和 set 的底层实现,以及一些数据库(如 Redis)的内部实现。
总结:红黑树通过旋转调整 解决了二叉树不平衡问题
3、B树
特点:
- B树是一种平衡的多路搜索树,每个节点可以有多个子节点,且子节点的数量范围通常称为B树的阶。
- 每个节点包含有序的键值对,节点内的关键字按升序排列。
总结:B树通过将多个键值存储在每个节点中,以及允许每个节点可以拥有更多的子节点,减少了树的高度。解决了红黑树高度、旋转的问题。
4、B+树
特点:
- 非叶子节点只存储key值不存储数据
- 所有的key值都可以在叶子节点上找到,且是有序的双向链表
总结:B+树通过非叶子节点只存储key值,且叶子节点是有序的双向链表,解决了B树高度、范围查找问题
5、总结
因此选择B+树是因为非叶子节点只存储索引,不存储数据,可以使每个节点存储更多索引,减小树的深度。叶子节点包含了所有索引的双向链表,方便了范围查询。
索引结构
1、聚簇索引和非聚簇索引
聚簇索引:
- mysql 中 innodb 存储引擎中的聚簇索引非叶子结点存储的是索引key(通常是主键),叶子节点存储的是行数据
非聚簇索引:
- mysql 中 innodb 存储引擎中的非聚簇索引非叶子结点存储的是索引,叶子节点存储的聚簇索引key
总结:
InnoDB 存储引擎中
- 如果表中有主键,则会使用主键来作为聚簇索引
- 如果表中没有主键,则会使用第一个唯一索引作为聚簇索引
- 如果主键和唯一索引都没有,会选择一个列或一组列作为聚簇索引
拓展:
MYISAM 存储引擎使用的是非聚簇索引,所有叶子节点存储的都是行数据地址的指针,因此在MYISAM中索引和数据是分开存储的。
2、Hash索引
mysql中除了B+树索引其实还有Hash索引,但是应用场景一般不多。默认使用B+树索引
特点:
- Hash索引使用哈希表实现,适合等值查询,因为它能提供接近O(1)的查找效率。但是,Hash索引并不支持范围查询,因为哈希表无法保持数据的顺序关系。
- 此外,哈希冲突的存在会导致性能下降,特别是在数据量大的情况下。而B+树索引即使面对大量数据,也能保持较好的性能。
3、总结
综上所述,InnoDB存储引擎之所以选择B+树作为索引结构,是因为它在保证查询效率的同时,还支持范围查询,并且具有更好的顺序读取性能。当然,这并不意味着B+树在所有场景下都是最佳选择,对于某些特定的使用案例,比如频繁的等值查询,且具有较少的hash冲突,Hash索引可能是一个更好的选择。