算法之分治

分而治之

分治法所能解决的问题一般具有以下几个特征：

该问题的规模缩小到一定的程度就可以容易地解决

该问题可以分解为若干个规模较小的子问题，即该问题具有最优子结构性质

利用该问题分解出的子问题的解 可以合并为 该问题的解

该问题所分解出的各个子问题是相互独立 的, 即子问题之间不包含公共的子问题

第一条特征是绝大多数问题都可以满足的, 因为问题的计算复杂性一般是随着问题规模的增加而增加.

第二条特征是应用分治法的前提它也是大多数问题可以满足的, 此特征反映了递归思想的应用.

第三条特征是关键 , 能否利用分治法完全取决于问题是否具有第三条特征, 如果具备了第一条和第二条特征, 而不具备第三条特征, 则可以考虑用贪心法 或动态规划法.

第四条特征 涉及到分治法的效率，如果各子问题是不独立的则分治法要做许多不必要的工作, 重复地解公共的子问题, 此时虽然可用分治法, 但一般用动态规划法较好.

快速排序

题目1: 颜色分类

此题和双指针算法中的 题目1: 移动零 很类似, 不过是多了一个指针去维护一块区域:

将区域划分为[0,left][left+1, cur][cur+1, right-1][right, n-1] 分别对应0区域, 1区域, 未判断区域, 2区域.

当 i 遍历时遇到 0 则交换 left+1位置和 i 位置的值, 因为left + 1位置的值:

如果[left+1, i]区间(值为1)长度大于0, 则 left+1 位置一定是1, 如果区间长度为0, 则 left+1 一定是0, 自己交换自己, 只是把值为0的区间更新了, 值为1的区间长度依然是0. 注意cur要++, 因为此时cur的值要么是0要么是1, 如果是0且cur不++则会陷入死循环.

当 i 遍历遇到1, 直接跳过

当 i 遍历遇到 2, 交换 right-1 和 i 位置的值, cur不要++

cpp 复制代码

class Solution {
public:
    void sortColors(vector<int>& nums) 
    {
        int cur = 0, left = -1, right = nums.size();
        int n = nums.size();
        while(cur < right)
        {
            if(nums[cur] == 0)
            {
                if(cur != ++left)
                    swap(nums[cur],nums[left]);
                cur++;
            }
            else if(nums[cur] == 2)
                swap(nums[cur],nums[--right]);
            else//nums[cur] == 1
                cur++;
        }
    }
};

题目2: 排序数组

快排最核心的一步就是 Partition (分割数据): 将数据按照一个标准, 分成左右两部分.

但是如果我们用上一题 三路划分 的思想，将数组划分为左中右三部分：左边是比基准元素小 的数据, 中间是与基准元素相同 的数据, 右边是比基准元素大的数据, 然后再去递归的排序左边部分和右边部分即可 (可以舍去大量的中间部分).

在处理数据量有很多重复的情况下，效率会大大提升

注意:

**1.**用随机数取基准值可以有效缓解一边倒的问题

**2.**小区间用插入排序优化速度.

(具体说明见数据结构之排序文章)

cpp 复制代码

class Solution {
public:
    void InsertSort(vector<int>& nums, int left, int right)
    {
        for(int i = left+1; i <= right; i++)
        {
            for(int j = i; j > left; j--)
            {
                if(nums[j] < nums[j-1])
                    swap(nums[j],nums[j-1]);
                else
                    break;
            }
        }
    }

    void _sortArray(vector<int>& nums, int begin, int end)
    {
        if(begin >= end)
            return;
        //小区间优化
        if(end-begin+1 <= 10)
        {
            InsertSort(nums, begin, end);
            return;
        }
        //随机数取基准元素
        int key = nums[begin + random()%(end-begin+1)];
        //三路划分
        int cur = begin, left = begin-1, right = end+1;
        while(cur < right)
        {
            if(nums[cur] < key)
            {
                if(cur != ++left)
                    swap(nums[left],nums[cur]);
                cur++;
            }
            else if(nums[cur] > key)
                swap(nums[--right],nums[cur]);
            else
                cur++;    
        }

        _sortArray(nums,begin,left);
        _sortArray(nums,right,end);
    }
    
    vector<int> sortArray(vector<int>& nums) 
    {
        srand(time(NULL));
        _sortArray(nums,0,nums.size()-1);
        return nums;
    }
};

题目4: 最小的 k 个数

注意: 因为这里找的是前k小, 所以k=a的情况可以合并到b>=k中, 因为k=a那么前a个元素就是前k小, 不需要管大小.

cpp 复制代码

class Solution {
public:
    void Partition(vector<int>& stock, int begin, int end, int k)
    {            

        int left = begin-1, right = end+1, cur = begin;
        int key = stock[begin + rand()%(end-begin+1)];
        while(cur < right)
        {
            if(stock[cur] < key)
            {
                if(cur != ++left)
                    swap(stock[cur],stock[left]);
                cur++;
            }
            else if(stock[cur] > key)
                swap(stock[cur],stock[--right]);
            else
                cur++;
        }
        int a = left -begin;
        int b = right - begin;
        if(k <= a)
            Partition(stock, begin, left, k);
        else if (k <= b)
            return;
        else
            Partition(stock, right, end, k - b);
    }

    vector<int> inventoryManagement(vector<int>& stock, int cnt) 
    {
        Partition(stock, 0, stock.size()-1, cnt);
        return {stock.begin(),stock.begin()+cnt};
    }
};

归并排序

题目1: 排序数组

归并排序的代码不作说明, 主要看tmp 放在局部 每次递归创建和 放在全局一次开辟好两者的时间消耗差异:

tmp在局部创建:

cpp 复制代码

class Solution {
public:
    void MergeSort(vector<int>& nums, int left, int right)
    {
        if(left >= right)
             return;
        //左右区间排序
        int mid = (left+right)/2;
        MergeSort(nums,left,mid);
        MergeSort(nums,mid+1,right);
        //再归并
        vector<int> tmp(right-left+1);
        int left1= left, left2 = mid+1;
        int right1 = mid, right2 = right;
        int index = 0;
        while(left1 <= right1 && left2 <= right2)
            tmp[index++] = nums[left1] <= nums[left2] ? nums[left1++] : nums[left2++];
        while(left1 <= right1)
            tmp[index++] = nums[left1++];
        while(left2 <= right2)
            tmp[index++] = nums[left2++];
        for(int i = left; i <= right; i++)
            nums[i] = tmp[i-left];
    }
    vector<int> sortArray(vector<int>& nums) 
    {
        MergeSort(nums,0,nums.size()-1);
        return nums;
    }
};

tmp提前开辟好:

cpp 复制代码

class Solution {
public:
    vector<int> tmp;

    void MergeSort(vector<int>& nums, int left, int right)
    {
        if(left >= right)
             return;
        //左右区间排序
        int mid = (left+right)/2;
        MergeSort(nums,left,mid);
        MergeSort(nums,mid+1,right);
        //再归并
        int left1= left, left2 = mid+1;
        int right1 = mid, right2 = right;
        int index = 0;
        while(left1 <= right1 && left2 <= right2)
            tmp[index++] = nums[left1] <= nums[left2] ? nums[left1++] : nums[left2++];
        while(left1 <= right1)
            tmp[index++] = nums[left1++];
        while(left2 <= right2)
            tmp[index++] = nums[left2++];
        for(int i = left; i <= right; i++)
            nums[i] = tmp[i-left];
    }
    vector<int> sortArray(vector<int>& nums) 
    {
        tmp.reserve(nums.size());
        MergeSort(nums,0,nums.size()-1);
        return nums;
    }
};

可以看到两者时间消耗近乎两倍, 所以涉及递归开辟空间最好提前把空间开辟好.

利用分治法解决该题目, 首先可以考虑到, record里的逆序对的个数等于将record分为两个区间, 左区间逆序对的个数 +右区间逆序对的个数 +**一个数在左区间一个数在右区间凑成的逆序对的个数.**如果单纯只是这样那和暴力枚举都一样, 但给两个区间都排序之后, 会发现问题和归并排序的思路一模一样. 因为给两个区间排序只是区间内局部顺序调整, 两个区间的相对顺序没有改变, 所以可以算出来逆序对.

策略1: 找出一个数之前, 有多少个数比我大, 此时要求数组必须是升序:

由于要挑选比我大的数, 所以要在左区间去找大的数, 如果左区间nums[cur1] <= nums[cur2], 那么左边没找到, cur1++; 如果nums[cur1] > nums[cur2], 由于数组是有序的, [cur1, mid]区间内所有的数都是大于nums[cur2]的, 所以记录下这个值, 然后cur2++.

可以发现这个逻辑是和归并排序排升序一模一样的.

策略2: 找出一个数之后, 有多少个数比我小, 此时要求数组必须是降序:

选比我小的数, 要去右区间找小的数. 如果 nums[cur2] >= nums[cur1], 说明没找到, cur2++;

nums[cur2] < nums[cur1], 找到了, 记录[cur2, end]区间的大小, 然后cur1++;

这个过程是和归并排序排降序一样的.

总结: 找我之前比我大的数, 升序, 看左区间是否小, 小就跳过, 然后归并; 找我之后比我小的数, 看右区间是否大, 大就跳过, 然后归并. (也就是归并排序归并的逻辑)

cpp 复制代码

class Solution {
public:
    vector<int> tmp;

    int MergeSort(vector<int>& record, int left, int right)
    {
        if(left >= right)
            return 0;

        int ret = 0;
        int mid = (right+left)>>1;
        //
        ret += MergeSort(record, left, mid);
        ret += MergeSort(record, mid+1, right);

        //处理一左一右
        int left1 = left, left2 = mid+1;
        int right1 = mid, right2 = right;
        int index = 0;
        while(left1 <= right1 && left2 <= right2)
        {
            if(record[left1] <= record[left2])
                tmp[index++] = record[left1++];
            else 
            {
                ret += (mid-left1+1);
                tmp[index++] = record[left2++];
            }
        }

        //排序
        while(left1 <= right1)
            tmp[index++] = record[left1++];
        while(left2 <= right2)
            tmp[index++] = record[left2++];
        
        for(int i = left; i <=right; i++)
            record[i] = tmp[i-left];

        return ret;
    }

    int reversePairs(vector<int>& record) 
    {
        tmp.reserve(record.size());
        return MergeSort(record, 0, record.size()-1);
    }
};

题目3: 计算右侧⼩于当前元素的个数

这道题和上一题的逆序对很类似, 但是它需要重新开辟一个counts数组, 还要在counts对应的原始下标处记录以该数为逆序对左元素时的逆序对个数, 关键就在于怎么去确定对应的index:

我们首先会想到用哈希表映射, 但是如果nums有重复元素x, 最后 count[hash[x]] 对应的是所有重复x 产生的逆序对个数, 显然不正确, 所以考虑用一个index数组去维护下标, 关键是 要在排序的过程中对于下标i, nums[i]和index[i]要同时移动, 保证它们的位置时刻绑定在一起:

由于要多维护一个index数组, 维护比一般的归并排序要麻烦一些, 合并的过程中需要有tmp_num去维护nums, tmp_index去维护index: (代码中用hash命名而不是index)

cpp 复制代码

class Solution {
public:
    vector<int> tmp_num;
    vector<int> tmp_index;
    vector<int> hash;
    vector<int> counts;
    
    void MergeSort(vector<int>& nums, int left, int right)
    {
        if(left >= right)
            return;
        int mid = (left+right)/2, index = 0;
        MergeSort(nums,left,mid);
        MergeSort(nums,mid+1,right);

        int left1 = left, end1 = mid;
        int left2 = mid+1, end2 = right;
        while(left1<=end1 && left2<=end2)
        {
            if(nums[left2] >= nums[left1])
            {
                tmp_num[index] = nums[left2];
                tmp_index[index] = hash[left2];
                index++;
                left2++;
            }
            else
            {
                counts[hash[left1]] += (end2-left2+1);
                tmp_num[index] = nums[left1];
                tmp_index[index] = hash[left1];
                index++;
                left1++;
            }
        }
        while(left1<=end1)
        {
            tmp_num[index] = nums[left1];
            tmp_index[index] = hash[left1];
            index++;
            left1++;
        }
        while(left2<=end2)
        {
            tmp_num[index] = nums[left2];
            tmp_index[index] = hash[left2];
            index++;
            left2++;
        }
        for(int i = left; i <= right;i++)
        {
            nums[i] = tmp_num[i-left];
            hash[i] = tmp_index[i-left];
        }
    }

    vector<int> countSmaller(vector<int>& nums) {
        int n = nums.size();
        tmp_num.reserve(n);
        tmp_index.reserve(n);
        hash.reserve(n);
        counts.resize(n,0);

        for(int i = 0; i < n;i++)
            hash[i] = i;

        MergeSort(nums, 0, n-1);
        return counts;
    }
};

题目4: 翻转对

策略一: 计算当前元素后面, 有多少元素的两倍比我小

对两个降序的区间进行判断, 在右区间找小, 固定cur1, 移动cur2, 若2*nums[cur2] >= nums[cur1], cur2++; 找到了就算出[cur2, end2]长度, 随后cur1++, cur2不需要回退, 因为对于x∈[left2, cur2], 2*x >= nums[cur1], 而对于y∈[cur1,end2], nums[cur1] >= y , 故2*x >= y, 所以 cur2 不需要回退.

在这里cur1和cur2是两个同向双指针

注意, 这里的判断逻辑和归并排序不能合并起来, 之前的逆序对是恰好判断逻辑和归并排序一模一样, 而这里需要单独进行计算.

策略二: 计算当前元素前面, 有多少元素的两倍比我大

同理

cpp 复制代码

class Solution {
vector<long long> tmp;
public:
    int MergeSort(vector<long long>& record, int left, int right){
        if(left >= right)
            return 0;

        int ret=  0;
        //1. 先根据中间元素划分区间
        int mid = (left+right)/2, index = 0;
        //2. 计算左右两侧的翻转对
        ret += MergeSort(record, left, mid);
        ret += MergeSort(record, mid+1, right);
        
        int begin1 = left, end1 = mid;
        int begin2 = mid+1, end2 = right;

        //3. 双指针, 计算翻转对的数量
        int cur1 = begin1, cur2 = begin2;
        while(cur1 <= end1)//降序
        {
            while(cur2 <= end2 && record[cur2]*2 >= record[cur1])
                cur2++;
            //cur2到末尾直接break
            if(cur2 > end2)
                break;
            ret += end2-cur2+1;
            cur1++;
        }
       //合并两个有序数组
        while(begin1 <= end1 && begin2<=end2)
        {
            if(record[begin2] >= record[begin1])
                tmp[index++] = record[begin2++];
            else
                tmp[index++] = record[begin1++];
        }

        while(begin1 <= end1)
            tmp[index++] = record[begin1++];

        while(begin2 <= end2)
            tmp[index++] = record[begin2++];

        for(int i = left; i <=right;i++)
            record[i] = tmp[i-left];

        return ret;
    }
    int reversePairs(vector<int>& nums) {
        int ret = 0;
        tmp.reserve(nums.size());
        vector<long long> nums_L(nums.begin(),nums.end());
        return MergeSort(nums_L, 0, nums.size()-1);
    }
};

分而治之

快速排序

题目1: 颜色分类

题目2: 排序数组

题目3: 数组中的第K大的元素

题目4: 最小的 k 个数

归并排序

题目1: 排序数组

题目2: 数组中的逆序对

题目3: 计算右侧⼩于当前元素的个数

题目4: 翻转对