文章目录
1.归并排序
归并排序的核心步骤是:
拆分:将无序数组不断对半拆分成小块,直到每个小块只剩一个元素(自然有序)。
合并:将相邻的有序小块合并,逐步形成更大的有序块,直到整个数组有序。
1.1 递归版本
递归天然避免越界,代码简洁,但递归深度受限。
cpp
#include <vector>
using namespace std;
// 合并两个有序子数组
void merge(int arr[], int left, int mid, int right)
{
vector<int> temp(right - left + 1); // 临时数组
int i = left, j = mid + 1, k = 0;
// 双指针合并有序区间
while (i <= mid && j <= right)
{
temp[k++] = (arr[i] <= arr[j]) ? arr[i++] : arr[j++];
}
// 处理剩余元素
while (i <= mid) temp[k++] = arr[i++];
while (j <= right) temp[k++] = arr[j++];
// 拷贝回原数组
for (int p = 0; p < k; p++)
{
arr[left + p] = temp[p];
}
}
// 递归归并排序
void mergeSort(int arr[], int left, int right) {
if (left >= right) return;
int mid = left + (right - left) / 2;
mergeSort(arr, left, mid);//分解左半区
mergeSort(arr, mid + 1, right);//分解右半区
merge(arr, left, mid, right);//合并有序区间
}
int main()
{
int arr[] = {12, 11, 13, 5, 6, 7};
int n = sizeof(arr)/sizeof(arr[0]);
mergeSort(arr, 0, n-1);
return 0;
}
1.2 非递归版本
非递归版本通过步长控制,把数组看作由多个有序子数组组成,逐步扩大子数组长度,直到整个数组有序。
非递归循环效率更高,适合大数据量,但是需要控制越界。
与递归版本不同的是递归是自顶向下(通过递归函数先拆分再合并),非递归是自底向上(通过数组下标直接从小块开始合并)
假设原始数组为 [3,1,4,2,7,5]
执行步骤如下:
步长=1:把每个元素视为独立的有序数组,两两合并→ 合并后 [1,3] [2,4] [5,7]
步长=2:合并相邻的两个长度为2的子数组→ 合并后 [1,2,3,4] [5,7]
步长=4:继续合并更大的子数组→ 最终得到 [1,2,3,4,5,7]
cpp
void mergeSort(int arr[], int n)
{
// 预分配临时空间
vector<int> temp(n);
// 按步长分组(1,2,4,8...)
for (int gap = 1; gap < n; gap *= 2)
{
// 每两组进行比较
//[left, left+gap-1] [left+gap,left+2*gap-1]
//[left,mid][mid+1, right]
for (int left = 0; left < n; left += 2*gap)
{
// 计算子数组边界 (按l,m,r)
int mid = min(left + gap - 1, n-1);
int right = min(left + 2*gap - 1, n-1);
// 合并相邻子数组
int i = left, j = mid + 1, k = left;
while (i <= mid && j <= right)
{
temp[k++] = (arr[i] <= arr[j]) ? arr[i++] : arr[j++];
}
// 处理剩余元素
while (i <= mid) temp[k++] = arr[i++];
while (j <= right) temp[k++] = arr[j++];
// 拷贝回原数组
for (int p = left; p <= right; p++)
{
arr[p] = temp[p];
}
}
}
}
int main()
{
int arr[] = {12, 11, 13, 5, 6, 7};
int n = sizeof(arr)/sizeof(arr[0]);
mergeSort(arr, n);
return 0;
}
2.归并分治
实施原理:
- 思考问题在大范围的答案,是否等于左部分的答案+右部分的答案+跨越左右部分的答案。
- 计算跨越左右部分的答案时,如果左右部分各自有序,是否能让计算跨越左右部分答案时更加便利。
分治法的基本步骤:
- 分解:将原始数组通过递归的方式拆分成两个长度相近的子数组,一直拆分到单个元素为止(因为单个元素天生有序)
- 统计:根据题意进行相关的统计。
- 排序:根据题意思考,在将小部分合并成大部分之前,如果将小部分进行排序,是否能便于大部分进行统计。
2.1 计算数组的小和
首先让我们看一组示例 [1,3,5,2,4,6],这个小和答案为27,其暴力解法很好想,就是每个数和其他的数进行比较进行累加,但时间复杂度是O(n^2)所以不考虑。
下面看看这题归并分治的解法。
1. 根据上面说的原理,我们先看整个大范围部分[1,3,5,2,4,6]的答案,是否可以通过左部分[1,3,5]加上右部分[2,4,6],再加上跨越左右的答案。
首先,我们直接计算[1,3,5]小和是5,[2,4,6]小和是8。接下来计算跨越左右的答案[1,3,5] | [2,4,6],可以看到两边内部的已经各种计算好了,那么跨越的先看2对应的2>1再2<3,那么对应2的小和就只有1。再看4对应的4>1,4>3,4<5那么4对应的小和就是4,6类推就是9,那么跨越的小和加起来就是14,再和前面相加14+5+8就是27答案对应上了。
2. 那么如果再把大范围缩小到计算[1,3,5]的答案,可以看出,其左部分[1,3]小和为1,右部分[5]小和为0,跨越左右为4,相加后也对应上了小和为5。那么就可以看出小部分的解和大部分的解都是一样的,那么就可以考虑归并分治。
3.接下来考虑在计算跨越左右的答案时,如果左、右部分各自有序这个条件,计算会不会更简单。我们看[1,3,5] | [2,4,6],如果其未排序[3,1,5] [6,2,4],那么对于未排序的计算,需要每个数和其他数进行比较累加,就是暴力解法。肯定是更复杂的!。
4.那么这道题,保持左右各有序后计算便利在哪?比如这个例子[3,6,7] [5,6,9]在计算跨越左右的答案时,有两种算法。
(1)从右部分开始对左部分的数进行比对 ,对应5大于3,对应6>3,6>=6,对应9>3,9>6,9>7,我们可以发现,右部分下一个数的计算(如5之后的6,6之后的9)可以在上一个数的基础上继续计算并且加上上一个数的和。
具体什么意思?就是比如右部分的5在和左部分3比较后再和左部分6比较,由于5<6那么左部分就到6停,下一个右部分的6直接和左部分的6进行比较,再和7比较然后停。右部分6的小和就直接加上5的小和和比较的6。右部分的9就直接加上6的小和以及比较的7。(这样就不用右部分每一个数都和左边的比了,因为有序)
(2)从左部分开始对右部分的数进行比对,如果5大于3,那么5后面所有的数都大于3,就直接3乘以5以及右边的个数就行了。
两个方法时间复杂度都是O(N),相当于把每个数都走了一遍。
对应从右部分开始对左部分的数进行比对
cpp
//代表整个跨左右的答案
long long ans = 0;
//先固定右部分的数,sum代表每个数自己的小和
for(int j = m+1, i = l, sum = 0; j <= r; ++j)
{
//每个数的小和 = 这一回的比较 + 上一个数的小和
while(i <= m && s[i] <= s[j]) sum+=s[i++];
ans += sum;
}
对应从左部分开始对右部分的数进行比对
cpp
//代表整个跨左右的答案
long long ans = 0;
for(int j = m+1, i = l; j <= r; ++j)
{
while(i <= m && s[i] <= s[j])
{
ans+=(r-j+1)*s[i];
++i;
}
}
完整代码
cpp
#include <iostream>
using namespace std;
const int MAXN = 100001;
int s[MAXN];
int tmp[MAXN];
long long Merge(int l, int m, int r)
{
//1.先统计
long long ans = 0;
for(int j = m+1, i = l, sum = 0; j <= r; ++j)
{
while(i <= m && s[i] <= s[j]) sum+=s[i++];
ans += sum;
}
/*
//计算方法二
long long ans = 0;
for(int j = m+1, i = l; j <= r; ++j)
{
while(i <= m && s[i] <= s[j])
{
ans+=(r-j+1)*s[i++];
}
}
*/
//2.再排序,方便后续部分的统计
int i = l, k = l, j = m+1;
while(i <= m && j <= r)
{
tmp[k++] = (s[i] <= s[j] ? s[i++] : s[j++]);
}
while(i <= m) tmp[k++] = s[i++];
while(j <= r) tmp[k++] = s[j++];
for (int i = l; i <= r; ++i)
{
s[i] = tmp[i];
}
return ans;
}
long long Count(int l, int r)
{
if(l == r) return 0;
int m = (l+r) >> 1;
//接下来进行细分,同时统计计算再排序
return Count(l, m) + Count(m+1, r) + Merge(l, m, r);
}
int main() {
int n = 0;
while(cin >> n)
{
for(int i = 0; i < n; ++i) cin>>s[i];
//首先对数组进行细分
cout << Count(0, n-1) << endl;
}
return 0;
}
2.2 计算翻转对
还是照着之前说的原理,拿[2,4,3,5,1],分成两个部分[2,4,3] [5,1],在假设两个部分分别计算好翻转对数量以及排序后,[2,4,3] 有0个翻转对,[5,1]是1个,统计完后因为各个内部翻转对已经计算好了,然后想排序后对于两边跨越的计算是否更便利,答案是肯定的,各自排序后。那么计算跨越左右的[2,3,4][1,5],也是有两种方法,简单的法一:3大于1*2了,那么排序后3之后都是大于3的,也就是都能和1能组成翻转对的。法二:3和1比完后,接着4和5比,然后再加上3对应的翻转对数。因为3满足的,4也满足。
cpp
class Solution {
public:
int tmp[50001] = {0};
int Merge(vector<int>& nums, int l, int m, int r)
{
//1.统计
int ans = 0;
//法一
// for(int i = l, j = m+1, count = 0; i <= m; ++i)
// {
// while(j <= r && nums[i] > (long)2*nums[j]) count++, ++j;
// ans += count;
// }
//法二
for(int i = l, j = m+1; i <= m; ++i)
{
while(j <= r && nums[i] > (long)2*nums[j])
{
ans += (m-i+1);
j++;
}
}
//2.排序
int a = l, b = l, c = m+1;
while(a <= m && c <= r)
{
tmp[b++] = (nums[a] <= nums[c] ? nums[a++] : nums[c++]);
}
while(a <= m) tmp[b++] = nums[a++];
while(c <= r) tmp[b++] = nums[c++];
for(int i = l; i <= r; ++i) nums[i] = tmp[i];
return ans;
}
int Count(vector<int>& nums, int l, int r)
{
if(l == r) return 0;
int m = (l+r) >> 1;
return Count(nums, l, m) + Count(nums, m+1, r) + Merge(nums, l, m, r);
}
int reversePairs(vector<int>& nums) {
int len = nums.size();
return Count(nums, 0, len-1);
}
};
算法中有很多精妙又美丽的思想传统,请务必坚持下去!!