【数据结构】优先级队列(堆)

文章目录


前言

本文会涉及到二叉树相关知识以及队列的相关知识,如有疑问可以查看博主前几篇文章(点击下方链接可以快捷进入 )或者评论区见。
栈和队列
树、二叉树


优先级队列

前面介绍过队列,队列是一种先进先出(FIFO)的数据结构,但有些情况下,操作的数据可能带有优先级,一般出队列时,可能需要优先级高的元素先出队列,该中场景下,使用队列显然不合适,比如:在手机上玩游戏的时候,如果有来电,那么系统应该优先处理打进来的电话;初中那会班主任排座位时可能会让成绩好的同学先挑座位。

在这种情况下,数据结构应该提供两个最基本的操作,一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue)。

优先级队列的模拟实现

JDK1.8中的PriorityQueue底层使用了堆这种数据结构,而堆实际就是在完全二叉树的基础上进行了一些调整。

堆的概念

如果有一个关键码的集合K = {k0,k1, k2,...,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储 在一个一维数组中,并满足:Ki <= K2i+1 且 Ki<= K2i+2 (Ki >= K2i+1 且 Ki >= K2i+2) i = 0,1,2...,则称为 小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。

堆的性质:
堆中某个节点的值总是不大于或不小于其父节点的值;
堆总是一棵完全二叉树。

堆的存储方式

从堆的概念可知,堆是一棵完全二叉树,因此可以层序的规则采用顺序的方式来高效存储。

注意:对于非完全二叉树,则不适合使用顺序方式进行存储,因为为了能够还原二叉树,空间中必须要存储空节点,就会导致空间利用率比较低。

将元素存储到数组中后,可以根据二叉树章节的性质5对树进行还原。假设i为节点在数组中的下标,则有:

如果i为0,则i表示的节点为根节点,否则i节点的双亲节点为 (i - 1)/2
如果2 * i + 1 小于节点个数,则节点i的左孩子下标为2 * i + 1,否则没有左孩子
如果2 * i + 2 小于节点个数,则节点i的右孩子下标为2 * i + 2,否则没有右孩子

堆的创建

堆向下调整

对于集合{ 27,15,19,18,28,34,65,49,25,37 }中的数据,如果将其创建成堆呢?

仔细观察上图后发现:根节点的左右子树已经完全满足堆的性质,因此只需将根节点向下调整好即可。

向下过程(以小堆为例):

让parent标记需要调整的节点,child标记parent的左孩子(注意:parent如果有孩子一定先是有左孩子)

如果parent的左孩子存在,即:child < size, 进行以下操作,直到parent的左孩子不存在

1.parent右孩子是否存在,存在找到左右孩子中最小的孩子,让child表示为最小孩子。

2.将parent与较小的孩子child比较,

如果:

(1)parent小于较小的孩子child,调整结束

(2)否则:交换parent与较小的孩子child,交换完成之后,parent中大的元素向下移动,可能导致子树不满足对的性质,因此需要继续向下调整,即parent = child;child = parent*2+1; 然后继续 。

java 复制代码
public class MyPriorityQueue {

    public int[] elem;
    public int usedSize;

    public MyPriorityQueue(int[] elem) {
        this.elem = new int[10];
    }

   

   public void shiftDown(int parent,int usedSize){
        int child = parent*2 + 1;
        while(child < usedSize){
            if(elem[child] < elem[child + 1]){
                child++;
            }
            if(elem[child] > elem[parent]){
                break;
            }
            swap(elem,parent,child);
            parent = child;
            child = parent*2 + 1;
        }
    }
    private void swap(int[] elem,int parent,int child){
        int tmp = elem[child];
        elem[child] = elem[parent];
        elem[parent] = tmp;
    }
}

注意:在调整以parent为根的二叉树时,必须要满足parent的左子树和右子树已经是堆了才可以向下调整。

时间复杂度分析:

最坏的情况即图示的情况,从根一路比较到叶子,比较的次数为完全二叉树的高度,即时间复杂度为O(logN)

堆的创建

对于普通的序列{ 1,5,3,8,7,6 },即根节点的左右子树不满足堆的特性,又该如何调整呢?

java 复制代码
public void createHeap(int[] array){
        for (int parent = 0; parent < array.length; parent++) {
            shiftDown(parent,usedSize);
            usedSize++;
        }
    }

我们用第一次那个比较复杂的长数组来测试一下代码是否正确:

java 复制代码
public class Main {
    public static void main(String[] args) {
        int[] array = {27,15,19,18,28,34,65,49,25,37};
        MyPriorityQueue myPriorityQueue = new MyPriorityQueue(array);
        myPriorityQueue.initElem(array);
        myPriorityQueue.createHeap();
    }
}

我们DeBug之后能看出来,确实变成了小根堆。

建堆的时间复杂度

因为堆是完全二叉树,而满二叉树也是完全二叉树,此处为了简化使用满二叉树来证明(时间复杂度本来看的就是近似值,多几个节点不影响最终结果):

不过,如果采用向上调整建堆,时间复杂度仍然是O(N*logN)。

堆的插入与删除

堆的插入

堆的插入总共需要两个步骤:

  1. 先将元素放入到底层空间中(注意:空间不够时需要扩容)
  2. 将最后新插入的节点向上调整,直到满足堆的性质
java 复制代码
public void offer(int val){
        if(isFull()){
            elem = Arrays.copyOf(elem,2*elem.length);
        }
        usedSize++;
        elem[usedSize - 1] = val;
        int child = usedSize;
        int parent = (child - 1)/2;
        while(parent >= 0){
            if(elem[child] > elem[parent]){
                break;
            }else{
                swap(this.elem,parent,child);
                child = parent;
                parent = (child - 1)/2;
            }
        }
    }
java 复制代码
public class Main {
    public static void main(String[] args) {
        int[] array = {27,15,19,18,28,34,65,49,25,37};
        MyPriorityQueue myPriorityQueue = new MyPriorityQueue(array);
        myPriorityQueue.initElem(array);
        myPriorityQueue.createHeap();
        myPriorityQueue.offer(10);
        myPriorityQueue.offer(60);
    }
}

经验证后代码无误。

堆的删除

注意:堆的删除一定删除的是堆顶元素。具体如下:

  1. 将堆顶元素对堆中最后一个元素交换
  2. 将堆中有效数据个数减少一个
  3. 对堆顶元素进行向下调整
java 复制代码
public int poll(){
        if(isEmpty()){
            return -1;
        }
        int val = elem[0];
        swap(elem,0,usedSize - 1);
        usedSize--;
        siftDown(0,usedSize);
        return val;
    }

    private boolean isEmpty(){
        return usedSize == 0;
    }

用堆模拟实现优先级队

java 复制代码
import java.util.Arrays;

public class MyPriorityQueue {

    public int[] elem;
    public int usedSize;

    public MyPriorityQueue(int[] elem) {
        this.elem = new int[10];
    }

    public void initElem(int[] array){
        for (int i = 0; i < array.length; i++) {
            elem[i] = array[i];
            usedSize++;
        }
    }

    public void createHeap(){
        for (int parent = (usedSize - 1) / 2; parent >= 0; parent--){
            siftDown(parent,usedSize);
        }
    }

    public void siftDown(int parent,int usedSize){
        int child = parent*2 + 1;
        while(child < usedSize){
            if(child + 1 < usedSize){
                if(elem[child] > elem[child + 1]){
                    child++;
                }
            }

            if(elem[child] > elem[parent]){
                break;
            }
            swap(elem,parent,child);
            parent = child;
            child = parent*2 + 1;
        }
    }
    private void swap(int[] elem,int parent,int child){
        int tmp = elem[child];
        elem[child] = elem[parent];
        elem[parent] = tmp;
    }

    public void offer(int val){
        if(isFull()){
            elem = Arrays.copyOf(elem,2*elem.length);
        }
        usedSize++;
        elem[usedSize - 1] = val;
        int child = usedSize - 1;
        int parent = (child - 1)/2;
        while(parent >= 0){
            if(elem[child] >= elem[parent]){
                break;
            }else{
                swap(this.elem,parent,child);
                child = parent;
                parent = (child - 1)/2;
            }
        }
    }

    private boolean isFull(){
        return usedSize == elem.length;
    }


    public int poll(){
        if(isEmpty()){
            return -1;
        }
        int val = elem[0];
        swap(elem,0,usedSize - 1);
        usedSize--;
        siftDown(0,usedSize);
        return val;
    }

    private boolean isEmpty(){
        return usedSize == 0;
    }

    public int peek(){
        if(isEmpty()){
            return -1;
        }
        return elem[0];
    }
}

常见习题

1.下列关键字序列为堆的是:()

A: 100,60,70,50,32,65 B: 60,70,65,50,32,100 C: 65,100,70,32,50,60

D: 70,65,100,32,50,60 E: 32,50,100,70,65,60 F: 50,100,70,65,60,32

2.已知小根堆为8,15,10,21,34,16,12,删除关键字8之后需重建堆,在此过程中,关键字之间的比较次数是()

A: 1 B: 2 C: 3 D: 4

4.最小堆[0,3,2,5,7,4,6,8],在删除堆顶元素0之后,其结果是()

A: [3,2,5,7,4,6,8] B: [2,3,5,7,4,6,8]

C: [2,3,4,5,7,8,6] D: [2,3,4,5,6,7,8]

参考答案

1.A 2.C 4.C

需要注意的是第二题:两个子结点需要先自己比较再和父节点比较。

常用接口介绍

PriorityQueue的特性

Java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列,PriorityQueue是线程不安全的,PriorityBlockingQueue是线程安全的,本文主要介绍PriorityQueue。

关于PriorityQueue的使用要注意:

  1. 使用时必须导入PriorityQueue所在的包,即:
java 复制代码
import java.util.PriorityQueue;
  1. PriorityQueue中放置的元素必须要能够比较大小,不能插入无法比较大小的对象,否则会抛出ClassCastException异常
  2. 不能插入null对象,否则会抛出NullPointerException
  3. 没有容量限制,可以插入任意多个元素,其内部可以自动扩容
  4. 插入和删除元素的时间复杂度为O(log2N)
  5. PriorityQueue底层使用了堆数据结构
  6. PriorityQueue默认情况下是小堆---即每次获取到的元素都是最小的元素

PriorityQueue常用接口介绍

优先级队列的构造

java 复制代码
public static void main(String[] args) {
        PriorityQueue<Integer> q1 = new PriorityQueue<>();
        PriorityQueue<Integer> q2 = new PriorityQueue<>(100);
        ArrayList<Integer> array = new ArrayList<>();
        array.add(1);
        array.add(2);
        PriorityQueue<Integer> q3 = new PriorityQueue<>(array);

        System.out.println(q3.size());
        System.out.println(q3.peek());
    }

用正常方法建立的优先级队列默认是小根堆,怎么变成大根堆呢?

我们去找到原码,可以看出原码这一块还有其他的构造方法。这些方法的参数里面可以传入实现了Comparator接口的比较器。

所以我们只需要改变默认的比较器就可以实现大根堆了,具体操作如下:

java 复制代码
static class MyCmp implements Comparator<Integer> {

        @Override
        public int compare(Integer o1, Integer o2) {
            return o2 - o1;
        }
    }
    public static void main(String[] args) {

        PriorityQueue<Integer> queue = new PriorityQueue<>(new MyCmp());
        queue.offer(1);
        queue.offer(4);
        queue.offer(2);
        queue.offer(3);
        System.out.println(queue.peek());
    }

如此做,最终的输出就是最大值4了。

常用方法介绍

最常用的还是这几样,我们模拟实现的时候写过了。

java 复制代码
public static void main(String[] args) {
        int[] arr = {4,1,9,2,8,0,7,3,6,5};
// 一般在创建优先级队列对象时,如果知道元素个数,建议就直接将底层容量给好
// 否则在插入时需要不多的扩容
// 扩容机制:开辟更大的空间,拷贝元素,这样效率会比较低
        PriorityQueue<Integer> q = new PriorityQueue<>(arr.length);
        for (int e: arr) {
            q.offer(e);
        }
        System.out.println(q.size()); // 打印优先级队列中有效元素个数
        System.out.println(q.peek()); // 获取优先级最高的元素
// 从优先级队列中删除两个元素之和,再次获取优先级最高的元素
        q.poll();
        q.poll();
        System.out.println(q.size()); // 打印优先级队列中有效元素个数
        System.out.println(q.peek()); // 获取优先级最高的元素
        q.offer(0);
        System.out.println(q.peek()); // 获取优先级最高的元素
// 将优先级队列中的有效元素删除掉,检测其是否为空
        q.clear();
        if(q.isEmpty()){
            System.out.println("优先级队列已经为空!!!");
        }
        else{
            System.out.println("优先级队列不为空");
        }
    }

PriorityQueue的扩容方式:

java 复制代码
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
private void grow(int minCapacity) {
int oldCapacity = queue.length;
// Double size if small; else grow by 50%
int newCapacity = oldCapacity + ((oldCapacity < 64) ?
(oldCapacity + 2) :
(oldCapacity >> 1));
// overflow-conscious code
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
queue = Arrays.copyOf(queue, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}

代码很复杂,简单说来就是这么一个逻辑:

如果容量小于64时,是按照oldCapacity的2倍方式扩容的
如果容量大于等于64,是按照oldCapacity的1.5倍方式扩容的
如果容量超过MAX_ARRAY_SIZE,按照MAX_ARRAY_SIZE来进行扩容

面试题

java 复制代码
public static int[] smallestK(int[] arr, int k) {
        if(arr == null){
            return null;
        }
        if(k == 0){
            return new int[0];
        }
        PriorityQueue<Integer> queue = new PriorityQueue<>(arr.length);
        for (int i = 0; i < arr.length; i++) {
            queue.add(arr[i]);
        }
        int[] ret = new int[k];
        for (int i = 0; i < k; i++) {
            ret[i] = queue.poll();
        }
        return ret;
    }

采用一直输出顶部结点(最小结点)的方法虽然很简单,但是并不是topK最好的做法,那topk该如何实现?

欲知后事如何,且听下一章分解😁😁😁


相关推荐
一勺菠萝丶6 小时前
[特殊字符] IDEA 性能优化实战(32G 内存电脑专用篇)
java·性能优化·intellij-idea
Metaphor6926 小时前
Java 将 HTML 转换为 Word:告别手动复制粘贴
java·经验分享·html·word
LiuYaoheng6 小时前
【Android】Android 的三种动画(帧动画、View 动画、属性动画)
android·java
lisanmengmeng6 小时前
apache-tomcat 安装部署
java·tomcat·apache
.ZGR.7 小时前
C语言:数组的增删查改2.0
c语言·开发语言
漫漫不慢.7 小时前
算法练习-二分查找
java·开发语言·算法
还是鼠鼠7 小时前
《黑马商城》Elasticsearch基础-详细介绍【简单易懂注释版】
java·spring boot·spring·elasticsearch·搜索引擎·spring cloud·全文检索
如竟没有火炬7 小时前
LRU缓存——双向链表+哈希表
数据结构·python·算法·leetcode·链表·缓存
牧羊人_myr7 小时前
Maven核心功能与项目构建详解
java·maven