当前位置：网站首页>堆（优先级队列）

堆（优先级队列）

2022-07-22 00:45:00 【m0_60631323】

一、优先级队列

1.1概念

在前面的学习中我们知道，队列是一种先进先出的数据结构，但在有些情况下，操作的数据可能带有优先级，此时使用队列是很难实现的
这种情况下，我们的数据结构应该提供最基本的两个操作，一个是返回最高优先级对象，一个是添加新的对象，这种数据结构就是优先级队列(Priority Queue)。.

二、优先级队列的模拟实现

JDK1.8中的PriorityQueue底层使用了堆的数据结构，而堆实际就是在完全二叉树的基础之上进行了一些元素的调整。
注意：

堆采用的完全二叉树结构，此时的树的节点按照顺序存储的方式存储在数组中.
区别于前面学习的二叉树的链式存储

2.1堆的概念

如果有一个关键码的集合K = {k0，k1， k2，…，kn-1}，把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中，并满足：Ki <= K2i+1 且 Ki<= K2i+2 (Ki >= K2i+1 且 Ki >= K2i+2) i = 0，1，2…，则称为小堆(或大堆)。

堆的性质：

堆中某个节点的值总是不大于或不小于其父节点的值；
堆总是一棵完全二叉树。

2.2堆的存储方式

因为堆是一棵完全二叉树，故堆可以以层序遍历的方式顺序的存储在数组中
在这里插入图片描述
注意：
对于非完全二叉树，不适合使用顺序方式进行存储，因为为了能够还原二叉树，空间中必须存储空节点，导致空间利用率低

将节点存储到了数组中后，可以根据下面的二叉树的性质对二叉树进行还原，假设i为节点在数组中的下标:

如果i为0，则i表示的节点为根节点，否则i节点的双亲节点为 (i - 1)/2
如果2 * i + 1 小于节点个数，则节点i的左孩子下标为2 * i + 1，否则没有左孩子
如果2 * i + 2 小于节点个数，则节点i的右孩子下标为2 * i + 2，否则没有右孩子

2.3堆的创建

对于集合{ 27,15,19,18,28,34,65,49,25,37 }中的数据，如果将其创建成堆呢？
我们先以完全二叉树的形式还原这棵树
在这里插入图片描述
下面我们以创建一个大根堆为例

总结：
1.从最后一棵子树调整
最后一棵子树的根节点的下标为p=(arr.length-1-1)/2;
p–得到下一棵子树根节点的下标
2.每棵子树调整的时候，都是向下调整
3.每棵子树向下调整的结束位置都是arr.length-1；

代码：

 public static void shiftDown(int parent) {
    
     //child先标记parent的左孩子，因为parent可能有左孩子没有右孩子
        int child = 2 * parent + 1;
        while (child < size) {
    
    //如果右孩子存在，找到左右孩子中较大的孩子,用child进行标记
            if(child+1 < size && array[child+1] >array[child]){
    
                child += 1;
            }
    //如果双亲比其最小的孩子还大，说明该结构已经满足堆的特性了
            if (array[parent] >= array[child]) {
    
                break;
            }else{
    
    //将双亲与较大的孩子交换
                int t = array[parent];
                array[parent] = array[child];
                array[child] = t;
    //parent中大的元素往下移动，可能会造成子树不满足堆的性质，因此需要继续向下调整
                parent = child;
                child = parent * 2 + 1;
            }
        }
    }
    public static void createHeap(int[] array) {
    
      // 找倒数第一个非叶子节点，从该节点位置开始往前一直到根节点，遇到一个节点，应用向下调整
        int root = ((array.length-2)>>1);
        for (; root >= 0; root--) {
    
            shiftDown(root);
        }
    }

向下调整(shiftDown)的时间复杂度：
最坏情况就是调整树的高度次，即O(logN)；

建堆的时间复杂度分析:

因为堆是完全二叉树，而满二叉树也是完全二叉树，此处为了简化使用满二叉树来证明(时间复杂度本来看的就是近似值，多几个节点不影响最终结果)

故建堆的时间是复杂度为O(N)

2.4堆的插入和删除

2.4.1 堆的插入

堆的插入共分为两个步骤：
1.将元素插入到堆的末尾，也就是最后一个孩子之后（如果空间不够需要扩容）
2.将最后插入的节点向上调整，直到满足堆的性质

下面演示的是在一个小根堆上插入元素的过程

在这里插入图片描述
代码：

public void offer(int e){
    
        array[size++]=e;
        shiftUp(size-1);
    }
public void shiftUp(int child) {
    
      //找到child的双亲
        int parent = (child - 1) / 2;
        while (child > 0) {
    
            //如果双亲比孩子小，parent满足堆的性质，调整结束
            if (array[parent] < array[child]) {
    
                break;
            }
            else{
    
       //将双亲与孩子节点进行交换
                int t = array[parent];
                array[parent] = array[child];

                array[child] = t;
// 小的元素向下移动，可能到值子树不满足对的性质，因此需要继续向上调增
                child = parent;
                parent = (child - 1) / 2;
            }
        }
    }

堆的插入的时间复杂度：O(logN)

2.4.2堆的删除

堆的删除一定删除的是堆顶元素
具体步骤如下：
具体如下：

将堆顶元素对堆中最后一个元素交换
将堆中有效数据个数减少一个
对堆顶元素进行向下调整

    public int poll(){
    
        int oldValue=array[0];
        array[0]=array[--size];
        shiftDown(0);
        return oldValue;
    }

2.4.3堆模拟实现优先级i队列

public class MyPriorityQueue {
    

    private int[] array = new int[100];
    private int size = 0;

    public void offer(int e){
    
        array[size++]=e;
        shiftUp(size-1);
    }
    public int peek(){
    
        return array[0];
    }
    public int poll(){
    
        int oldValue=array[0];
        array[0]=array[--size];
        shiftDown(0);
        return oldValue;
    }
    public  void shiftDown(int parent) {
    
        //child先标记parent的左孩子，因为parent可能有左孩子没有右孩子
        int child = 2 * parent + 1;
        while (child < size) {
    
            //如果右孩子存在，找到左右孩子中较大的孩子,用child进行标记
            if(child+1 < size && array[child+1] >array[child]){
    
                child += 1;
            }
            //如果双亲比其最小的孩子还大，说明该结构已经满足堆的特性了
            if (array[parent] >= array[child]) {
    
                break;
            }else{
    
                //将双亲与较大的孩子交换
                int t = array[parent];
                array[parent] = array[child];
                array[child] = t;
                //parent中大的元素往下移动，可能会造成子树不满足堆的性质，因此需要继续向下调整
                parent = child;
                child = parent * 2 + 1;
            }
        }
    }

    public void shiftUp(int child) {
    
      //找到child的双亲
        int parent = (child - 1) / 2;
        while (child > 0) {
    
            //如果双亲比孩子小，parent满足堆的性质，调整结束
            if (array[parent] < array[child]) {
    
                break;
            }
            else{
    
       //将双亲与孩子节点进行交换
                int t = array[parent];
                array[parent] = array[child];

                array[child] = t;
// 小的元素向下移动，可能到值子树不满足对的性质，因此需要继续向上调增
                child = parent;
                parent = (child - 1) / 2;
            }
        }
    }

}

2.5常见习题

在这里插入图片描述

2.

3.

4. 在这里插入图片描述

三、PriorityQueue介绍

3.1PriorityQueue的特性

Java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列，PriorityQueue是线程不安全的，PriorityBlockingQueue是线程安全的，这里主要介绍PriorityQueue。

使用PriorityQueue的注意事项：

使用时必须导入PriorityQueue所在的包，即：

import java.util.PriorityQueue;

PriorityQueue中放置的元素必须要能够比较大小，不能插入无法比较大小的对象，否则会抛出
ClassCastException异常
不能插入null对象，否则会抛出NullPointerException
没有容量限制，可以插入任意多个元素，其内部可以自动扩容
插入和删除元素的时间复杂度为O(logN)
PriorityQueue底层使用了堆数据结构
PriorityQueue默认情况下是小堆—即每次获取到的元素都是最小的元素
如果需要使用大堆需要用户提供比较器
PriorityQueue的默认容量是11 ：

3.2 PriorityQueue的常用接口

PriorityQueue中的重要属性
在这里插入图片描述

构造方法
所有的构造方法

下面主要介绍几种常见的构造方法

(1) 不带参数的构造方法
发现不带参数的构造方法会调用带两个参数的构造方法，并指定容量为默认初始容量11
在这里插入图片描述

(2) 带一个参数的构造方法
在这里插入图片描述
(3)带两个参数的构造方法

(4)利用集合创建优先级队列
使用示例：

public static void main(String[] args) {
    
        ArrayList<Integer> list = new ArrayList<>();
        list.add(4);
        list.add(3);
        list.add(2);
        list.add(1);
       //用ArrayList对象来构造一个优先级队列的对象
        PriorityQueue<Integer> q3 = new PriorityQueue<>(list);
        System.out.println(q3.size());//4
        System.out.println(q3.peek());//1
  }

插入/删除/获取优先级最高的元素功能介绍以及源码分析

(1)插入元素的过程
第一次插入元素的过程

第二次插入元素的过程:

建一个大根堆

public static void main(String[] args) {
    
      PriorityQueue<Integer> q=new PriorityQueue<>(new Comparator<Integer>() {
    
          @Override
          public int compare(Integer o1, Integer o2) {
    
              return o2-o1;
          }
      });
        q.offer(10);
        q.offer(20);
        q.offer(30);
        System.out.println(q.peek());//30
    }

JDK1.8中的扩容方式
在这里插入图片描述

3.3 优先级队列的应用

TOP-K问题：即求数据集合中前K个最大的元素或者最小的元素，一般情况下数据量都比较大。
比如：专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
对于Top-K问题，能想到的最简单直接的方式就是排序，但是：如果数据量非常大，排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决，基本思路如下：

用数据集合中前K个元素来建堆
前k个最大的元素，则建小堆
前k个最小的元素，则建大堆
用剩余的N-K个元素依次与堆顶元素来比较，不满足则替换堆顶元素
将剩余N-K个元素依次与堆顶元素比完之后，堆中剩余的K个元素就是所求的前K个最小或者最大的元素。

时间复杂度分析：
堆的元素个数为k，故每次向下调整的时间复杂度就是O(logk)，总共需要调整n-k次，故总体时间复杂度为O((n-k)logk)

但初次接触Top-k问题的同学肯定这样想过，如果要求的是找出前K个最大的元素，就直接将所有元素建成一个大根堆，然后依次出K个元素就可以了啊！！！

这中做法的确可以，但由于时间复杂度过高而一般不采取
如果对于一个数组中一共有n个数据，想找前n-1个最大值，那么每次出元素后都要重新调整一下堆，每次向下调整的时间复杂度是O(logn)，所以总体的时间复杂度就是O(nlogn)；

最小K个数
代码:

 public int[] smallestK(int[] arr, int k) {
    
        int[] ret=new int[k];
        if(k<=0||k> arr.length){
    
            return ret;
        }
        PriorityQueue<Integer> maxHeap=new PriorityQueue<>(new Comparator<Integer>() {
    
            @Override
            public int compare(Integer o1, Integer o2) {
    
                return o2-o1;
            }
        });
        for (int i = 0; i <arr.length; i++) {
    
            if(maxHeap.size()<k){
    
         maxHeap.offer(arr[i]);
            }else {
    
                int top=maxHeap.peek();
            if(arr[i]<top){
    
                maxHeap.poll();
                maxHeap.offer(arr[i]);
            }
            } 
        }
        for (int i = 0; i < k; i++) {
    
            ret[i]=maxHeap.poll();
        }
       return ret;
    }

前K个高频单词
因为这里用到了map和set，在后续map和set中有详细说明

  public  static  List<String> topKFrequent(String[] words, int k) {
    
        Map<String ,Integer> map= new HashMap<>();
        for (String word:words) {
    
            if(!map.containsKey(word)){
    
                map.put(word,1);
            }else {
    
                int val=map.get(word);
                map.put(word,val+1);
            }
        }
        PriorityQueue<Map.Entry<String,Integer>> minHeap=new PriorityQueue<>(new Comparator<Map.Entry<String, Integer>>() {
    
            @Override
            public int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2) {
    
               if(o1.getValue().compareTo(o2.getValue())==0){
    
                   return o2.getKey().compareTo(o1.getKey());
               }
                return o1.getValue().compareTo(o2.getValue());
            }
        });
        for (Map.Entry<String ,Integer> entry:map.entrySet()) {
    

            if(minHeap.size()<k){
    
                minHeap.add(entry);
             }else {
    
                Map.Entry<String ,Integer>  top=minHeap.peek();
                Integer val=top.getValue();
                if(val.compareTo(entry.getValue())<0){
    
                    minHeap.poll();
                    minHeap.add(entry);
                } else if(val.compareTo(entry.getValue())==0){
    
                    String key=top.getKey();
                    if(key.compareTo(entry.getKey())>0){
    
                          minHeap.poll();
                          minHeap.add(entry);
                    }
                }
            }
        }
        List<String> list=new ArrayList<>();
        for(int i=0;i<k;i++){
    
            String key=minHeap.poll().getKey();
            list.add(key);
        }
        Collections.reverse(list);
        return list;
    }

四、堆的应用

4.1堆排序

利用堆的思想进行排序,总共分为两个步骤;

建堆

升序：建大堆
降序：建小堆

利用堆删除的思想来进行排序

（1）交换堆顶与堆尾元素，此时usedSize–
（2）向下调整为大根堆在这里插入图片描述

public void heapSort(){
    

    createHeap(array);
    int end=usedSize-1;
		while(end>0){
    
		 int tmp=elem[0];
		 elem[0]=elem[end];
		 elem[end]=tmp;
		  end--;
		 shiftDown(end);
		}

}