如果有一个关键码的集合K = {k0,k1, k2,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储 在一个一维数组中,并满足:Ki <= K2i+1 且 Ki<= K2i+2 (Ki >= K2i+1 且 Ki >= K2i+2) i = 0,1,2…,则称为小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。
从堆的概念中不难看出,堆实际上是一个特殊的完全二叉树。必须满足的条件是:对于每一个根结点都小于它的孩子结点(小堆)或者每一个根节点都大于孩子结点(大堆)。
如下图:
堆是一颗完全二叉树,可以按照层序的规则采用顺序的方式进行存储。(对于非完全二叉树,在存储过程中会存储空结点,浪费空间)
将元素存储到数组中后,可以根据二叉树章节的性质5对树进行还原。假设i为节点在数组中的下标,则有:
如果i为0,则i表示的节点为根节点,否则i节点的双亲节点为 (i - 1)/2
如果2 * i + 1 小于节点个数,则节点i的左孩子下标为2 * i + 1,否则没有左孩子
如果2 * i + 2 小于节点个数,则节点i的右孩子下标为2 * i + 2,否则没有右孩子
在讲堆的建立之前,我们要了解一个非常重要的操作:向下调整。
我们以建小根堆为例,给定这样一个完全二叉树:
我们要把它变成一个小根堆,就要使用到向下调整的方法,对于小根堆我们要保证每一个根结点都小于它的叶子结点(如果有叶子结点)。步骤如下:
public void shiftDown(int[] array, int parent) {
int child = 2*parent+1;//左孩子结点
while(child<array.length) {
if(child+1< array.length&&array[child]<array[child+1]) {
//先判断右孩子存不存在,再找出两个孩子中的较大孩子
child+=1;//child指向较大的孩子结点
}
if(array[parent]>array[child]) {//比最大的孩子还大,向下调整
swap(array,parent,child);
}else{
break;
}
parent = child;//继续向下调整
child = 2*parent+1;
}
注意:在调整以parent为根的二叉树时,必须要满足parent的左子树和右子树已经是堆了才可以向下调整。
对于一个普通序列:根节点的左右子树不满足堆的特性,我们又该如何调整呢?
答案仍然是利用向下调整,只不过我们要从下向上考虑。步骤如下:
public static void createHeap(int[] array) {
int root = (array.length-1-1)/2;//根据孩子结点求根结点
for(;root>=0;root--) {
shiftDown(array,root);
}
}
堆的插入总共需要两个步骤:
这时,我们所做的实际上是一种向上调整。仍然以小根堆为例,下面是代码实现:
public static void shiftUp(int[] array,int child) {
int parent = (child-1)/2;
while(child>0) {
if(array[parent]>array[child]) {
swap(array,parent,child);
}else{
break;
}
child = parent;
parent = (child-1)/2;
}
}
比较向上调整与向下调整:
1、向上调整是通过child结点去找parent结点,而向下调整是通过parent结点去找child结点。
2、建堆的时候使用向下调整,而不使用向上调整。因为向下调整操作的复杂度较低。
堆的删除一定删除的是堆顶元素。具体如下:
前面介绍过队列,队列是一种先进先出(FIFO)的数据结构,但有些情况下,操作的数据可能带有优先级,一般出队列时,可能需要优先级高的元素先出队列,
在这种情况下,数据结构应该提供两个最基本的操作:一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue)。
我们接下来使用堆的操作模拟实现优先级队列,直接上代码:
import java.util.Arrays;
public class PriorityQueue {
public int[] array;
public int usedSize;
public static final int default_Capacity = 10;//默认容量
public PriorityQueue() {
this.usedSize = 0;
this.array = new int[default_Capacity];
}
/**
*
* @param array
*/
public void createHeap(int[] array) {
int parent = (array.length-2)/2;
for(;parent>=0;parent--) {
shiftDown(parent,usedSize);
}
}
public static void swap (int[] array,int parent,int child) {
int tmp = array[parent];
array[parent] = array[child];
array[child] = tmp;
}
/**
*
* @param parent 是每棵子树的根节点的下标
* @param len 是每棵子树调整结束的结束条件
* 向下调整的时间复杂度:O(logn)
*/
private void shiftDown(int parent,int len) {
int child = 2*parent+1;
while(child<len) {
if(child+1<len&&array[child]<array[child+1]) {
child+=1;//child指向较大的孩子结点
}
if(array[parent]>array[child]) {
swap(array,parent,child);
}else{
break;
}
parent = child;
child = 2*parent+1;
}
}
/**
* 入队:仍然要保持是大根堆
* @param val
*/
public void push(int val) {
if(isFull()) {
array = Arrays.copyOf(array,2*array.length);
}
array[usedSize] = val;
usedSize++;
shiftUp(usedSize-1);
}
private void shiftUp(int child) {
int parent = (child-1)/2;
while(child>0) {
if(array[parent]>array[child]) {
swap(array,parent,child);
}else{
break;
}
child = parent;
parent = (child-1)/2;
}
}
public boolean isFull() {
return usedSize == array.length;
}
/**
* 出队【删除】:每次删除的都是优先级高的元素
* 仍然要保持是大根堆
*/
public int pollHeap() {
int tmp = array[0];
swap(array,0,usedSize-1);
usedSize--;
shiftDown(0,usedSize);
return tmp;
}
public boolean isEmpty() {
return usedSize==0;
}
/**
* 获取堆顶元素
* @return
*/
public int peekHeap() {
return array[0];
}
}
三种构造器:
常用方法:
堆排序即利用堆的思想来进行排序,总共分为两个步骤:
public void heapSort() {
int end = usedSize-1;
while (end > 0) {
swap(0,end);
siftDown(0,end-1);
end--;
}
TOP-K问题:即求数据集合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
基本思路如下:
//使用比较器创建小根堆
class LessIntComp implements Comparator<Integer> {
@Override
public int compare(Integer o1, Integer o2) { return o1 - o2; }
}
//使用比较器创建大根堆
class GreaterIntComp implements Comparator<Integer>{
@Override
public int compare(Integer o1, Integer o2) { return o2 - o1;
}
}
public class TestDemo<E> { //求最小的K个数,通过比较器创建大根堆
public static int[] smallestK(int[] array, int k) {
if(k <= 0) {
return new int[k];
}
GreaterIntComp greaterCmp = new GreaterIntComp();
PriorityQueue<Integer> maxHeap = new PriorityQueue<>(greaterCmp);
//先将前K个元素,创建大根堆
for(int i = 0; i < k; i++) {
maxHeap.offer(array[i]);
}
//从第K+1个元素开始,每次和堆顶元素比较
for (int i = k; i < array.length; i++) {
int top = maxHeap.peek();
if(array[i] < top) {
maxHeap.poll();
maxHeap.offer(array[i]);
}
}
//取出前K个
int[] ret = new int[k];
for (int i = 0; i < k; i++) {
int val = maxHeap.poll();
ret[i] = val;
}
return ret;
}