算法：hot100---128. 最长连续序列

题目：128. 最长连续序列

128. 最长连续序列

思路分析

要设计时间复杂度为O(N)的方法，O(N*logN)就不能考虑了，也就是说，这道题排序是用不了了。

那想要降低时间复杂度，肯定是要用到类似hash的思想，

所以，我的第一反应，是使用位图，

因为，单纯使用hash表，我当时想的是，

使用hash表统计完存在的元素后，查找非常方便，

但是我统计长度的时候，是从前往后遍历，我把每一个元素都当成了连续序列的起点进行计算，这也就导致超时了，O(N*N)，

于是，转换思路，使用位图，因为位图中的元素是连续存储的，天然帮我排好序了，

所以我开辟了一个比较大的位图，把nums中的所有元素全部存储到位图中，

然后就是很简单的问题了，统计最长连续子数组的个数。

但是，我忽略了一个问题，我在统计的过程中需要遍历整个位图。

由于位图中并不仅仅存储了nums中的数据，更存储了很多的无效数据/空数据，

这就导致实际的时间复杂度远大于O(N)，导致最后超时，

虽然思路没问题，但是没有考虑实际的情况。

以上是两种错误的解法，下面讲解一下正确的做法。

还是得使用hash，

但是问题在于，我们不能够遍历所有的子序列，如果遍历所有的子序列，妥妥的O(N*N)，

因此，应该每次遍历一个完整的连续子序列，怎么遍历一个完整的连续子序列？

当然要从起点遍历到终点，

终点很好找，就是 e + 1在哈希表中不存在，

起点呢？也就很类似了，e - 1在hash表中不存在。

然后就从起点开始一直e++，直到 e - 1在hash表中不存在。

这么一看，还是要两重遍历啊，但是，两重遍历，时间复杂度不一定是O(N*N)啊，

仔细分析，实际上：

最外面一层O(N)肯定是有的，

中间的一层循环，只是遍历每一个连续序列，

nums有几个连续序列，这个循环才会走几遍，

这些连续序列的循环遍历，合起来其实就相当于遍历了一次nums，

总时间复杂度是O(2N)，也就是O(N)级别，no problem。

代码

c 复制代码

int longestConsecutive(vector<int>& nums) {
        //这道题目的核心思路是从每个连续序列的起点开始遍历
        //看似是O(n^n)的时间复杂度，
        //但是只有遇到一个新的序列的时候，才会启动第二层while
        //所有的第二层while拼接起来才是一个O(N)
        //也就是说，时间复杂度应该是O(2 * N)也就是O(N)级别
        //反倒是使用位图，看起来是O(N)的时间复杂度，
        //但是由于位图中有非常多空位置/无效位置，浪费了相当多的空间
        //最后的时间复杂度实际上是超过了O(N)的
        if(nums.size() == 0) return 0;

        unordered_set<int> hash(nums.begin(),nums.end());
        int maxlen = INT_MIN;
        for(auto& e:hash)
        {
            if(hash.count(e - 1) == 0) //e元素就是一个序列的起点
            {
                int count = 1;
                int tmp = e;
                while(hash.count(tmp+1))//看似是O(N^N)的时间复杂度
                                        //但是实际上当有几个序列，就遍历几次额外的while
                                        //这些额外的while遍历才是真正的遍历数组
                {
                    count++;
                    tmp++;
                }
                maxlen = max(maxlen,count);
            }
        }

        return maxlen;
    }