在STL的容器中,分为几种容器:
键值对,顾名思义其用来表示具有一一对应的关系的一种结构,该结构中一般只包含两个成员变量,即Key
与Value
;
在STL中存在一种这样的容器template <class T1, class T2> struct pair;
;
这个容器是一个类模板,其源码中的底层构造大致为:
template <class T1, class T2>
struct pair {
typedef T1 first_type;
typedef T2 second_type;
T1 first;
T2 second;
pair() : first(T1()), second(T2()) {}
pair(const T1& a, const T2& b) : first(a), second(b) {}
};
可以看到模板参数共有两个分别为T1与T2;
其成员变量只有两个分别为first
与second
从而能够使该容器具有key
与value
一对一的关系;
AVL树(Adelson-Velsky and Landis Tree)它是一种自平衡的二叉搜索树,由苏联的数学家Georgy Adelson-Velsky和Evgenii Landis于1962年首次提出;
AVL树又被称为高度平衡搜索二叉树,它是基于搜索二叉树的基础上的高度平衡搜索二叉树,其性质主要为:
以该图为例,该图即为一棵AVL树,其每个节点的左右子树高度差都不超过1;
那么在AVL树的结构中就有几个需要注意的点:
在实现容器或数据结构的过程中可以尽量的使用模板来保证其泛型;对于一棵简单的AVL实现可以根据需要(key
模型 或 是key
,value
模型)来确定实现该数据结构的模板参数个数;
而该篇文章的AVL树实现将针对后者,即key
,value
模型来进行实现;
AVL树中的节点一般为三叉链结构,即节点内存在三个指针来控制指向,分别为:
_left
节点,指向节点的左子树;_right
节点,指向节点的右子树;_parent
节点,指向节点的父亲节点;设定义一个变量使用pair<T1,T2>
容器来存放插入的数据,其中pair<T1,T2>
中的T1
对应着key
,value
模型中的key
,T2
对应着模型中的value
数据;
同时可以设置一个平衡因子变量,以平衡因子的变化来判断该树是否要进行调整,当该树不平衡时则使用某种方式将该树调整回平衡状态,使其结构恢复为AVL
树;
template<class K,class V>
struct AVLTreeNode{
pair<K, V> _kv;//
AVLTreeNode<K, V> *_left;//指向左子树
AVLTreeNode<K, V> *_right;//指向右子树
AVLTreeNode<K, V> *_parent;//指向其父亲节点
int _bf ;//平衡因子
AVLTreeNode(const pair<K,V> &kv)
:_kv(kv)
,_left(nullptr)
,_right(nullptr)
,_parent(nullptr)
,_bf(0)
{}
};
从上文可知,AVL树可以看作是一棵搜索二叉树,其为基于搜索二叉树在此基础上对树做了平衡的操作使其在结构上变得平衡不至于在极端情况下出现"歪脖子树"的情况;
AVL树的定义与平衡搜索二叉树的结构上呈现类似;
template<class K,class V>
class AVLTree{
typedef AVLTreeNode<K,V> Node;//将节点进行typedef
public:
bool Insert(const K& key);
protected:
private:
Node *_root = nullptr;//节点指针
};
该篇文章中重点实现AVL树中的插入操作;
AVL树的插入操作与搜索二叉树的插入操作类似,唯独不同的是AVL树在进行插入操作时需要对树的结构进行判断,即判断插入过后该树是否还符合AVL树的规则(节点的左右子树高度差不超过1);
当树的结构规则被破坏时则需要采用一些特定的方式对树的结构进行调整;
新节点所插入的位置必是为空节点nullprtr
,判断所插入数据pair<K,V>
中的key
值是否大于当前节点;
大于当前节点
当所插入数据的key
值大于当前节点数据说明需要插入在该节点的右子树区域;
小于当前节点
当所插入数据的key
值小于当前节点数据说明需要插入在该节点的左子树区域;
等于当前节点
当所插入数据的key
值等于当前节点中的数据时,根据搜索二叉树的定义即数据的唯一性,该数据的值已经存在于该树中,该新节点不予插入,返回false
;
bool Insert(const std::pair<K,V>& kv){
if (_root == nullptr){
_root = new Node(kv);
return true;
}
Node *parent = nullptr;
Node *cur = _root;//
while (cur){/*当cur节点为空时表示该位置可以进行插入*/
/*插入*/
if (cur->_kv.first < kv.first) {
parent = cur;
cur = cur->_right;
}
else if (cur->_kv.first > kv.first){
parent = cur;
cur = cur->_left;
}
else{//cur->_kv.first == kv.first
return false;
}
}
/*与所插入的叶子节点进行链接*/
cur = new Node(kv);
if (parent->_kv.first < kv.first){
parent->_right = cur;
}
else{
parent->_left = cur;
}
cur->_parent = parent;
/*
更新平衡因子...
判断树的结构规则是否符合AVL树的规则
1.符合 不影响下一个节点的插入
2.不符合 使用旋转的方式对树进行调整
*/
return true;
}//Insert函数反括号
判断树是否符合AVL树的规则有两种:
创建子函数
每当插入一个数据时调用子函数来判断树的整体结构是否符合节点的左右子树高度差不超过1
;
使用平衡因子
使用平衡因子的方式即将AVL树节点的结构中加入一个变量来判断节点的平衡因子;
当平衡因子为0
时表示该节点左右子树高度差为0
;
当平衡因子为1
或-1
时表示该节点的左右子树高度差为1
;
当平衡因子为2
或-2
时表示该节点的左右子树高度差为2
,已经不平衡,需要进行特定操作使其恢复AVL树的平衡状态;
在本文中所使用的方式为方式二
,即采用平衡因子的方式来对树的节点进行判断;
在上文中提到了对与新节点的插入;
若是搜索二叉树对新节点进行插入时则不需要再对树的结构进行判断,但是在AVL树中则要对AVL树的结构进行判断;
当然再判断树的平衡因子前首先应该在插入节点之后对各个节点的平衡因子进行更新;
对于平衡因子的更新有三种情况:
新插入节点的平衡因子
新插入节点的平衡因子必定为0,因为其左右子树都为空节点nullptr
;
新节点在节点的左子树中
当新节点在节点(新节点的祖先节点)的左子树中时,节点(新节点的祖先节点)的平衡因子需要进行--
;
新节点在节点的右子树中
当新节点在节点(新节点的祖先节点)的右子树中时,节点(新节点的祖先节点)的平衡因子需要进行++
;
一般平衡因子的更新与平衡因子的检查(树结构的检查)是同一时间的,检查的情况也会出现四种情况:
平衡因子更新后为0
当平衡因子在更新过后为0
时则表示这次的插入对树(子树)的平衡状态反而起到了使其平衡的作用;
在该次判断后可以直接跳出循环结束插入;
平衡因子更新后为1
当平衡因子更新过后为1
时表示这次的插入对树(子树)的平衡状态从完全平衡(左右高度差为0
)变成了高度平衡(左右高度差为1
),这个变化可能影响到了这个节点的其他的祖先节点,所以应该继续往上进行更新,判断其它的祖先节点是否被影响成非高度平衡状态(左右子树高度差为2
);
平衡因子更新后为2
当平衡因子更新过为2
时表示可以不用再继续向上遍历判断,因为该树(子树)已经不平衡,需要对该树(子树)进行处理;
当处理结束之后可直接跳出循环结束插入操作;
平衡因子完全错乱
这种情况是避免平衡因子完全错乱;
当上面的三个条件都不满足时则表示平衡因子很可能已经混乱,整棵树的结构获取都变得不平衡,需要直接退出程序并对程序进行检查;
while (parent)
{
if (cur == parent->_left)
{
//新节点为其
parent->_bf--;
}
else // if (cur == parent->_right)
{
parent->_bf++;
}
/*
判断树的结构是否符合AVL树的规则
*/
if (parent->_bf == 0)
{
// 更新结束
break;
}
else if (parent->_bf == 1 || parent->_bf == -1)
{
/*
继续往上更新
可能影响到了该节点的其他祖先节点应继续向上更新并对其祖先节点进行判断其子树是否存在不平衡的状态;
*/
cur = parent;
parent = parent->_parent;
}
else if (parent->_bf == 2 || parent->_bf == -2)
{
/*
子树不平衡
需要进行旋转操作对树进行调整
*/
break;
}
else
{
/*平衡因子出现问题,对程序断死防止错误插入导致的更大问题*/
assert(false);
}
AVL树中当其平衡因子的绝对值等于2
时表示该节点左右子树的高度差为2
,这时候表示这棵AVL树已经不平衡,需要对其进行调整;
那么当AVL树不平衡时如何对树进行操作?
对于旋转操作中分为四种操作:
左单旋操作
以树(子树)中的某个指定节点作为轴点,对这棵树进行左单旋操作;
右单旋操作
以树(子树)中的某个指定节点作为轴点,对这棵树进行右单旋操作;
左右双旋操作
以树(子树)中的某个指定节点作为轴点,对这棵树进行左单旋操作;
再以该树(子树)中的另一个指定节点作为轴点,对这棵树进右单旋操作;
右左双旋操作
以树(子树)中的某个指定节点作为轴点,对这棵树进行左单旋操作;
再以该树(子树)中的另一个指定节点作为轴点,对这棵树进右单旋操作;
当一棵树(子树)中节点的平衡因子的绝对值为2时将会出现几种情况:
该图分别对应着几种需要进行旋转操作的情况;
那么如何理解几种旋转操作?
从上文可知,右单旋操作即为以树(子树)中的某个指定节点作为轴点,对这棵树进行右单旋操作
;
该图为需要进行右单旋操作树(子树)的抽象图;
当子树a
的高度由h
变为h+1
时由于60
节点的左子树高于右子树,其平衡因子由-1
变为-2
;
a
子树的高度变化影响到了其祖先节点;
具象图及变化操作:
h
为0
时
当h
高度为0
时,其红色节点即为新增节点,在该处节点新增时将会触发右单旋操作的情况;
只需将cur
节点所指向的右子树节点变成parent
节点的左子树;
parent
节点变为cur
节点的右子树;
在该操作之后在h
高度为0
的情况下三个节点的平衡因子都将转化为0
,使树的结构恢复为AVL树的结构;
h
为1
时
当h
高度为1时,两个红色节点的任意一个节点为新增节点时都将触发右单旋操作的情况;
再该中情况中,只需要将cur
节点的右子树curright
节点变为parent
节点的左子树,再将parent
节点变为cur
节点的右子树即可;
再该操作之后在h
高度为1
的情况下parent
节点与cur
的平衡因子将变为0
;
h
为2
时
相较上面两种场景当中,当h
为2
时其的情况将会变得更多;
以最单纯的抽象图为例:
当h
为2
时,a
子树的情况必定为情况①(只有当a
子树为情况①时对a处进行新增节点才会触发右单旋操作);
b
子树与c
子树的情况为①②③情况的其中一种;
以该图为例,其旋转操作不再进行赘述;
代码片段
void RotateR(Node *parent){
//左高右旋
Node *cur = parent->_left;
Node *curright = cur->_right;
parent->_left = curright;
if (curright)
curright->_parent = parent;
Node *ppnode = parent->_parent;
cur->_right = parent;
parent->_parent = cur;
if (ppnode == nullptr)
{
/*该树若是不为子树其cur节点将更新为根节点*/
_root = cur;
cur->_parent = nullptr;
}
else
{
if (ppnode->_left == parent)
{
ppnode->_left = cur;
}
else
{
ppnode->_right = cur;
}
cur->_parent = ppnode;
}
parent->_bf = cur->_bf = 0;
}
左单旋与右单旋的操作相反,其几种情况与右单旋的几种情况相同,只不过节点(子树)位置不同;
此处只对左单旋情况中的抽象图进行解析;
该图为例,该图即为需要对左单旋进行操作的情况;
当右子树高度高于左子树且平衡因子等于2
时则需要对子树进行旋转操作;
旋转结束之后其cur
节点与parent
节点的平衡因子将恢复为0
;
其结构整体恢复为AVL树的结构状态;
代码片段
void RotateL(Node* parent){
//右高左旋
Node *cur = parent->_right;
Node *curleft = cur->_left;
parent->_right = curleft;
if (curleft)
{
curleft->_parent = parent;
}
cur->_left = parent;
Node *ppnode = parent->_parent;
parent->_parent = cur;
if (parent == _root)
{
_root = cur;
cur->_parent = nullptr;
}
else
{
if (ppnode->_left == parent)
{
ppnode->_left = cur;
}
else
{
ppnode->_right = cur;
}
cur->_parent = ppnode;
}
parent->_bf = cur->_bf = 0;
}
左右双旋操作,顾名思义在这种情况种需要用到两种单旋的方式使树的结构恢复为以往的AVL树的状态;
抽象图
该图即为左右双旋操作的抽象图;
当这种情况时b
子树或者c
子树的高度由h
转变为h+1
时都将破坏该AVL树的结构;
当出现这种情况时即需要使用双旋操作来完成对树结构的恢复;
为什么当这种情况不能使用单旋操作对树的结构进行恢复?
以该抽象图为例,该抽象图中的c
子树的高度由h-1
变为了h
;
对应的左子树的高度高于右子树,若是用单旋的话需要进行一个右单旋操作;
而再该种情况下若是使用右单旋操作,最终的结果还是一个不平衡的状态;
故在这种情况中不能使用单旋操作来解决AVL树中的不平衡状态;
根据上文所提,在该种情况中只能使用两种单旋操作的方式组合成双旋操作使得最终使得树的结构恢复为平衡状态;
该图即为左右双旋操作的大致操作流程;
从上面的抽象图中也可以衍生几个例子以加深对双旋操作的理解;
当树的高度h
为0
当红色节点为新增节点时需要触发左右双旋操作;
当树的高度h
为1
当红色节点或绿色节点为新增节点时需要触发左右双旋操作;
该处旋转演示为绿色节点;
当树的高度h
为2
当树的高度h
为2
时,将会有多种情况;
其中a
子树与d
子树分别为①②③中的任意一种;
下图为树的高度h
为2
时的其中一种情况以及旋转方式;
当绿色节点与红色节点其中一个节点为新增节点时需要进行左右双旋操作;
此处旋转操作演示以绿色节点为例;
代码段
void RotateLR(Node *parent){
Node *cur = parent->_left;
Node *curright = cur->_right;
int bf = curright->_bf;
RotateL(parent->_left);
RotateR(parent);
/*对平衡因子重新进行调整*/
if (bf == 0)
{
parent->_bf = 0;
cur->_bf = 0;
curright->_bf = 0;
}
else if (bf == -1)
{
parent->_bf = 1;
cur->_bf = 0;
curright->_bf = 0;
}
else if (bf == 1)
{
parent->_bf = 0;
cur->_bf = -1;
curright->_bf = 0;
}
}
对于双旋操作来说,该操作只需要去调用单旋操作的接口即可;
但除此之外还需要对其中的平衡因子进行调整(在单旋中的平衡因子调整并不是双旋操作所期望的结果,故需要在最后对平衡因子进行调整);
右左双旋操作与左右双旋操作相同,只不过调用左单旋接口与右单旋接口的顺序不同,其对应的平衡因子调整也与之不同;
该处直接对几种情况的具象图对右左双旋操作进行解析;
具象图情况
当树的高度h
为0
当树的高度h
为1
此处演示了其中的两种情况;
当树的高度h
为2
该处可以类比于左右双旋操作,对此不再进行赘述;
代码段
void RotateRL(Node *parent){
Node *cur = parent->_right;
Node *curleft = cur->_left;
int bf = curleft->_bf;
RotateR(parent->_right);
RotateL(parent);
/*对平衡因子重新进行调整*/
if (bf == 0)
{
cur->_bf = 0;
curleft->_bf = 0;
parent->_bf = 0;
}
else if (bf == 1)
{
cur->_bf = 0;
curleft->_bf = 0;
parent->_bf = -1;
}
else if (bf == -1)
{
cur->_bf = 1;
curleft->_bf = 0;
parent->_bf = 0;
}
else
{
assert(false);
}
}
至此插入函数的逻辑到此结束;
如上题,如何在插入过后对AVL树的结构进行检查,确保在数据插入后能检查此AVL树的实现是否存在问题;
从该问题中可以以上文了解到AVL树的性质规则:
左右子树的高度差不超过1
;
符合搜索二叉树的规则;
左右子树的高度差的判断可以使用两种方法,即采用递归的方式判断该树是否符合AVL树的规则;
由于该树是基于搜索二叉树的规则进行设置,故对于树的存储规则可以不用过分追究;
同时由于树节点的结构中存储了平衡因子,为了防止特殊情况的平衡因子异常导致的树的结构紊乱,应该在检查过程中添加对于平衡因子检查的控制,即一个节点的左右子树的高度差是否符合该节点的平衡因子;
代码段
bool IsBalance(){
return IsBalance(_root);
}
bool IsBalance(Node *root){
if(root == nullptr){
return true;
}
int leftH = getHeight(root->_left); // the leftH is subtree height for left;
int rightH = getHeight(root->_right);
if(rightH - leftH != root->_bf){
cout << "平衡因子异常:" << root->_kv.first << "->" << root->_bf << endl;
return false;
}//
return abs(rightH - leftH) < 2
&& IsBalance(root->_left)
&& IsBalance(root->_right);
}
#pragma once
#include<iostream>
#include<assert.h>
using namespace std;
template<class K,class V>
struct AVLTreeNode{
pair<K, V> _kv;
AVLTreeNode<K, V> *_left;
AVLTreeNode<K, V> *_right;
AVLTreeNode<K, V> *_parent;
int _bf ;
AVLTreeNode(const pair<K,V> &kv)
:_kv(kv)
,_left(nullptr)
,_right(nullptr)
,_parent(nullptr)
,_bf(0)
{}
};
template<class K,class V>
class AVLTree{
typedef AVLTreeNode<K,V> Node;
public:
bool Insert(const std::pair<K,V>& kv){
if (_root == nullptr)
{
_root = new Node(kv);
return true;
}
Node *parent = nullptr;
Node *cur = _root;
while (cur)
{
if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
cur = new Node(kv);
if (parent->_kv.first < kv.first)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
cur->_parent = parent;
// ... 控制平衡
// 更新平衡因子
while (parent)
{
if (cur == parent->_left)
{
parent->_bf--;
}
else // if (cur == parent->_right)
{
parent->_bf++;
}
if (parent->_bf == 0)
{
// 更新结束
break;
}
else if (parent->_bf == 1 || parent->_bf == -1)
{
// 继续往上更新
cur = parent;
parent = parent->_parent;
}
else if (parent->_bf == 2 || parent->_bf == -2)
{
// 子树不平衡了,需要旋转
if (parent->_bf == 2 && cur->_bf == 1)
{
RotateL(parent);
}
else if (parent->_bf == -2 && cur->_bf == -1)
{
RotateR(parent);
}
else if (parent->_bf == 2 && cur->_bf == -1)
{
RotateRL(parent);
}
else if (parent->_bf == -2 && cur->_bf == 1)
{
RotateLR(parent);
}
break;
}
else
{
assert(false);
}
}
return true;
}//Insert函数反括号
bool IsBalance(){
return IsBalance(_root);
}
bool IsBalance(Node *root){
if(root == nullptr){
return true;
}
int leftH = getHeight(root->_left); // the leftH is subtree height for left;
int rightH = getHeight(root->_right);
if(rightH - leftH != root->_bf){
cout << "平衡因子异常:" << root->_kv.first << "->" << root->_bf << endl;
return false;
}//
return abs(rightH - leftH) < 2
&& IsBalance(root->_left)
&& IsBalance(root->_right);
}
void InOrder()
{
_InOrder(_root);
}
protected:
int getHeight(){
return getHeight(_root);
}
int getHeight(Node *root){
if(root == nullptr){
return 0;
}
int left = getHeight(root->_left);
int right = getHeight(root->_right);
return left>right?left+1:right+1;
}
void RotateL(Node* parent){
//右高左旋
Node *cur = parent->_right;
Node *curleft = cur->_left;
parent->_right = curleft;
if (curleft)
{
curleft->_parent = parent;
}
cur->_left = parent;
Node *ppnode = parent->_parent;
parent->_parent = cur;
if (parent == _root)
{
_root = cur;
cur->_parent = nullptr;
}
else
{
if (ppnode->_left == parent)
{
ppnode->_left = cur;
}
else
{
ppnode->_right = cur;
}
cur->_parent = ppnode;
}
parent->_bf = cur->_bf = 0;
}
void RotateR(Node *parent){
//左高右旋
Node *cur = parent->_left;
Node *curright = cur->_right;
parent->_left = curright;
if (curright)
curright->_parent = parent;
Node *ppnode = parent->_parent;
cur->_right = parent;
parent->_parent = cur;
if (ppnode == nullptr)
{
_root = cur;
cur->_parent = nullptr;
}
else
{
if (ppnode->_left == parent)
{
ppnode->_left = cur;
}
else
{
ppnode->_right = cur;
}
cur->_parent = ppnode;
}
parent->_bf = cur->_bf = 0;
}
void RotateLR(Node *parent){
Node *cur = parent->_left;
Node *curright = cur->_right;
int bf = curright->_bf;
RotateL(parent->_left);
RotateR(parent);
if (bf == 0)
{
parent->_bf = 0;
cur->_bf = 0;
curright->_bf = 0;
}
else if (bf == -1)
{
parent->_bf = 1;
cur->_bf = 0;
curright->_bf = 0;
}
else if (bf == 1)
{
parent->_bf = 0;
cur->_bf = -1;
curright->_bf = 0;
}
}
void RotateRL(Node *parent){
Node *cur = parent->_right;
Node *curleft = cur->_left;
int bf = curleft->_bf;
RotateR(parent->_right);
RotateL(parent);
if (bf == 0)
{
cur->_bf = 0;
curleft->_bf = 0;
parent->_bf = 0;
}
else if (bf == 1)
{
cur->_bf = 0;
curleft->_bf = 0;
parent->_bf = -1;
}
else if (bf == -1)
{
cur->_bf = 1;
curleft->_bf = 0;
parent->_bf = 0;
}
else
{
assert(false);
}
}
void _InOrder(const Node *root)
{
if (root == nullptr)
return;
_InOrder(root->_left);
std::cout << root->_kv.first << " : " << root->_kv.second << std::endl;
_InOrder(root->_right);
}
private:
Node *_root = nullptr;
};