【优选算法 & 分治】深入理解分治算法:分治算法入门小专题详解


快速排序算法


(1) 快速排序法



(2) 快排前后指针



(3) 快排挖坑法



颜色分类


题目解析



算法原理


算法原理和移动零非常相似


简述移动零的算法原理

  • cur 在从前往后扫描的过程中,如果扫描的数符合 f 性质,就把这个数放到 dest 之前的区域;
  • 符合 g 性质则不管,知道 cur 遍历到最后,dest 指针就可以把数组划分成两个部分;

解法:三指针


当 i 遍历结束数组后,整个数组就被排好序了,并且数组以 left,right 两个指针为分界线分成三个部分;


在遍历的过程中,整个数组会被划分成四个部分:


对遍历到的 nums[ i ] 的不同元素的分类处理



nums[ i ] = 0


对于上面这种情况,我们只需要 swap( nums[ left + 1] , nums [ i ] ) left++,i ++ 即可,要注意nums[left+1]=1 ;


但是有一种极端情况,就是如果 i = left + 1,并且也符合 nums[ i ] = 0 的情况,我们依旧要执行 swap( nums[ left + 1] , nums [ i ] );

虽然这种极端情况是变成自己和自己交换,但是处理方法不变:交换完成后,left ++ , i ++;


nums[ i ] = 1


此时我们令 i ++ 即可;


nums[ i ] = 2


对于这种情况,我们可以 swap( nums[ i ] , nums[ right - 1 ] ) ,然后 right-- ;


此时需要特别注意,swap( nums[ i ] , nums[ right - 1 ] ) 后,i 是不可以 ++ 的,因为 [ i ,right-1 ] 是待扫描区域,交换后,nums[ i ] 依旧是待扫描元素,所以 i 如果是和 right -1交换的情况,i 是一定不可以++的


处理细节问题


循环终止条件


当待扫描区域已经没有元素,说明此时数组所有元素已经全部被扫描并且分好类了,结束循环即可,所以循环终止条件是 i != right;


指针初始化


根据我们上面的算法原理,为了保证 left 指向 0 区域的最右边, right 区域指向 2 区域的最左边,我们交换元素是不会让 nums[ left ] ,nums[ right ] 亲自和 nums[ i ] 进行交换的:


所以我们的指针初始化的值如下:

这样的操作是为了避免漏掉对 nums[ 0 ] ,nums [ n - 1 ] 的扫描;


编写代码


报错原因

  • 交换元素的方法不对;
  • 并且初始化 left,和 right 的操作没有处理好,会漏掉对 nums[ 0 ] ,nums [ n - 1 ] 的扫描


使用快速排序来排序数组


题目解析



算法原理


解法:原始快速排序


原始快速排序


而原始快速排序的方法最核心的步骤,就在于根据基准元素进行数据划分的过程,这个步骤的名字是 partation;


但是,如果使用快速排序的数组有重复元素,那么快排的时间复杂度就会退化:


解法:用" 数组分三块 " 的思想实现快速排序


这是基于原始快速排序的优化策略,用于应对快速排序的数组有大量重复元素的情况,从对数组分成两块划分为分成三块:

在数组出现大量重复元素时,通过把数组分成三段,可以把时间复杂度从 O(N^2) 降到 O(N);


分类讨论


我们通过递归不断对划分的小区域排序,最终得到排好序的数组;


优化:用随机的方式选择基准元素


如果要想让快排的时间复杂度趋于 O(N* logN) ,就需要随机地选择基准元素;

随机选择基准元素,就是给我们一个数组,我们要等概率地返回区间上的任意一个数;


如何随机地选择一个基准元素呢?


编写代码


准备工作


传入要排序的左区间和右区间:

如果 L >= R,则说明排序的区间要么只有一个,要么这个区间没有元素,说明整个数组已经排序完毕;


随机生成基准元素 & 初始化下标


要记一下如何生成随机数下标,以及要特别注意这里的初始化 left != -1 ,right != nums.length:



把数组分三块



[ left + 1 , right - 1 ] 这块区域用于存与生成的随机基准元素值相同的元素 ,并且以这块区域为基准,把其他数组元素分到这三块区域对应的区域;

可以记一下这个 partation 的过程,这是快排的核心逻辑;


[ L , left ] & [ right , R ] 进行排序


根据 nums[ i ] 与 key 的大小关系,把所有元素放到 [ left + 1 , right - 1 ] 的两边(两边还是乱序的),再对两边区域进行递归排序即可;


快速选择算法


数组中的第K个最大元素


题目解析



算法原理



解法:基于快排实现快速选择算法


快速排序 Partation


本题是要找出数组中第 K 大的元素 KthLarges,那么我们可以根据基准元素,来判断 KthLarges 是落在上面三个区域的哪一个区域,然后对这个区域进行继续进行 Partation,继续找 KthLarges;


根据 K 的值分情况讨论,确定 KthLarges 的区间位置


我们先分别设三个区间的元素个数:



处理细节问题



我们解释一下这种情况:


编写代码


先根据快排 partation 原理,把数组分三块



根据 k 的值来决定递归三块中的哪一块区域



最小的k个数


题目解析



算法原理


解法一:直接排序


时间复杂度 O( N * logN)


解法二:使用大根堆( 求最小的前K个数)


时间复杂度 O( N * logK )


解法三:快速选择算法


时间复杂度趋于 O( N ) ,因为是随机选择基准元素,步骤如下:


对 K 的值分类讨论



(1) a > k



(2) b >= k


这种情况我们直接返回前面两个区域的前 k 个小的元素即可,不用关心 [ L , right ] 区间的顺序;


(3) k > b+c



通过这三种情况,我们就能明显的感受到快速选择排序是最优的解法;

比如第三种情况,此时[ L ,right ] 区间是没有排序的,但是我们依旧已经找到了最小的 k 个元素的一部分;而其他两种情况都是要对数组的每一个元素进行排序;


编写代码


我们是对 nums 的前 k个元素进行排序,把然后把 nums 的前 k 个元素赋值个 ret,然后返回;


​​​​报错原因:粗心导致 left & right 指针的初始值写错了



归并排序


  1. 当数组块被分成每一块都只有一个元素,分块结束;
  2. 用双指针合并两个有序数组;
  3. 归并排序的决策树非常像二叉树的后续遍历( 左右根 ),而快排则类似前序遍历(先对数组整体粗糙分一遍,再去两边区域细分);

使用归并排序来排序数组


题目解析


编写代码



优化:辅助数组设置为全局变量


把 tmp 设置为全局,就不用在每次递归时,创建一个新的 tmp ,减少时间开销;


java 复制代码
    int[] nums, tmp ;

    public int[] sortArray(int[] _nums) {
        nums = _nums;
        tmp = new int[nums.length]; 
        mergeSort(0, nums.length - 1);
        return nums;
    }

    public void mergeSort(int left ,int right){
        if(left >= right) return;

        int mid = (left + right) / 2;

        mergeSort(left , mid);
        mergeSort(mid + 1 , right);

        int cur1 = left; 
        int cur2 = mid + 1; 
        int i = 0 ; 

        while(cur1 <= mid && cur2 <= right){
            tmp[i++] = nums[cur1] <= nums[cur2] ? nums[cur1++] : nums[cur2++] ; 
        }

        while(cur1 <= mid) tmp[i++] = nums[cur1++];
        while(cur2 <= right) tmp[i++] = nums[cur2++];

        for(int j = left ; j <= right ; j++ ) 
            nums[j] = tmp[j - left]; 
    }

数组中的逆序对


题目解析



算法原理


解法一:暴力枚举


固定其中一个数,在这个数后面区间找比这个数小的数,来构成一个逆序对; 使用两层 for 循环即可,但是会超时;


解法二:归并排序


算法原理



(1) 左半部分 + 右半部分 + 一左一右


本质还是暴力枚举,逆序对个数 = a + b + c


(2) 左半部分 + 左排序 + 右半部分 + 右排序 + 一左一右 + 排序


对左右两边排好序,再一左一右挑数组成逆序对,并不影响结果:


本题为什么可以利用归并排序解决问题?



并且通过这步操作,我们得出本题最终的解法,就是需要通过归并排序求逆序对个数;

我们在找出左右两边的逆序对个数时,先对两边排序再一左一右,会非常快:


一左一右查找逆序对策略优化


我们在之前找左右两边区域的所有逆序对时,就刻意地对左右两边进行排序,找完左右两边的逆序对时,nums 的两边区域的顺序已经被排序成升序,此时我们需要一左一右寻找逆序对;


策略一 : 判断 nums[cur1]>nums[cur2] + 升序


统计一左一右逆序对的固定策略


固定 cur2, 只要 cur1 一移动到 **nums[cur1]>nums[cur2]**位置,就统计符合要求的区间的元素个数,cur2++;


假设我们固定 cur2,要在左边找有多少个比 nums[ cur2 ] 大的元素

令 cur1 在左边区域中从左到右扫描,找出第一个 nums[ cur1 ] > nums[ cur2 ] 的 cur1


(1) nums[ cur1 ] <= nums[ cur2 ]


我们直接让 cur1++ ,并且为了让数组有序,我们要把 nums[cur1] 放入辅助数组中,方便后续排序,继续往后找即可:


(2) nums[ cur1 ] > nums[ cur2 ]


出现这种情况,对于两边升序区域,当 nums[ cur1 ] > nums[ cur2 ] ,说明此时 cur1 指向的元素,是左边区域第一个比 nums[ cur2 ] 大的元素;cur1 后面所有元素都比 nums[ cur2 ] 大

也因为是升序排序,在 cur1 一走到第一个合法位置时, ret += mid - cur1 + 1即可;

本轮 cur2 的所有能拿到的逆序对就已经统计好了,此时 cur2++ 即可;


如果策略一使用降序排列会出现的问题


对于降序排序,我们依旧是需要固定 cur2;

我们依旧需要采取【 只要 cur1 一移动到**nums[cur1]>nums[cur2]**的位置,就统计符合这个要求的区间的元素个数】的策略


如下图的情况:

因为是降序排序的,所以 cur2 不能因为 nums[cur1]>nums[cur2] 就马上++ ,还必须看下一个 cur1 能否满足 nums[cur1]>nums[cur2] :

因为采取了【 只要 cur1 一移动到 nums[cur1]>nums[cur2] 的位置,就统计符合这个要求的区间的元素个数】的策略,因此就会造成大量的重复计算;


cur1 一移动,判断是否大于 cur2,如果判断成立,马上就让 ret += cur1 - left +1,所以会出现多次重复计算;

所以使用策略一,在排序数组时不能用降序,避免大量重复计数,所以只能用升序;


策略二 : nums[cur1]<nums[cur2] + 降序


统计一左一右逆序对的固定策略


固定 cur2, 只要 cur1 一移动到 **nums[cur1]<nums[cur2]**位置,就统计符合要求的区间的元素个数,cur2++;



编写代码


策略一 + 升序


准备工作


主逻辑


策略二 + 降序




计算右侧小于当前元素的个数


题目解析



算法原理


这道题的本质,还是类似于求逆序对的个数;


解法:归并排序(左半部分 + 左排序 + 右半部分 + 右排序 + 一左一右 + 排序)


一左一右策略:nums[ cur1 ] < nums[ cur2 ] + 降序(上一题策略二)


  • nums[ cur1] <= nums[ cur2 ] ,cur2++;修改对应的辅助数组;
  • nums[ cur1 ] > nums[ cur2 ],把 nums[ cur1 ] 对应 ret[ ] 下标的元素加上 right - cur2 + 1; 修改对应的辅助数组;

处理细节问题


我们要找到 nums[ cur1 ] 对应 ret[ ] 的对应下标 ,因为我们排序的时候,下标已经乱了;


如果我们使用哈希表来设置 < nums 元素 , ret 下标 > 的映射,如果 nums有重复元素,哈希表无法存储重复元素,就无法解决下标混乱的问题;


所以我们设置与 nums 同等规模的数组 index[ ],表示 nums 未排序时元素的原始下标,


不管 nums 因为排序,里面的元素怎么移动,index 对应的元素绑定移动:

那如何让 nums[] 和 index[] 绑定移动呢?我们需要创建两个辅助数组 tmp,来让它们同步移动;

最后,让 ret [ index[ i ] ] += right - cur2 + 1 即可;


编写代码


准备工作



核心逻辑


报错原因:对于降序排序的一左一右操作不熟练,判断条件写错了 ;



翻转对


拓展


直接插入排序



选择排序



冒泡排序



相关推荐
硕风和炜42 分钟前
【LeetCode: 112. 路径总和 + 二叉树 + 递归】
java·算法·leetcode·面试·二叉树·递归
Flerken1012 小时前
力扣【SQL连续问题】
数据库·sql·算法·leetcode·数据分析
AomanHao2 小时前
【阅读笔记】基于FPGA的红外图像二阶牛顿插值算法的实现
图像处理·笔记·算法·fpga开发·插值·超分
走在考研路上2 小时前
力扣242.有效的字母异位词
算法·leetcode·职场和发展
sjsjs112 小时前
【数据结构-堆】力扣2530. 执行 K 次操作后的最大分数
数据结构·算法·leetcode
yvestine3 小时前
数据挖掘——朴素贝叶斯分类
人工智能·算法·机器学习·分类·数据挖掘·贝叶斯分类
佑我中华3 小时前
C语言程序设计(第5版)习题解答-第4章
c语言·算法·图论
終不似少年遊*3 小时前
数据结构之线性表
数据结构·笔记·python·算法·线性表
嘻嘻哈哈樱桃3 小时前
有效字母异位词力扣--242
java·javascript·leetcode
yvestine3 小时前
数据挖掘——模型的评价
人工智能·算法·机器学习·数据挖掘·混淆矩阵·模型评价·正确率