题目:128. 最长连续序列

思路分析
要设计时间复杂度为O(N)的方法,O(N*logN)就不能考虑了,也就是说,这道题排序是用不了了。
那想要降低时间复杂度,肯定是要用到类似hash的思想,
所以,我的第一反应,是使用位图,
因为,单纯使用hash表,我当时想的是,
使用hash表统计完存在的元素后,查找非常方便,
但是我统计长度的时候,是从前往后遍历,我把每一个元素都当成了连续序列的起点进行计算,这也就导致超时了,O(N*N),
于是,转换思路,使用位图,因为位图中的元素是连续存储的,天然帮我排好序了,
所以我开辟了一个比较大的位图,把nums中的所有元素全部存储到位图中,
然后就是很简单的问题了,统计最长连续子数组的个数。
但是,我忽略了一个问题,我在统计的过程中需要遍历整个位图。
由于位图中并不仅仅存储了nums中的数据,更存储了很多的无效数据/空数据,
这就导致实际的时间复杂度远大于O(N),导致最后超时,
虽然思路没问题,但是没有考虑实际的情况。
以上是两种错误的解法,下面讲解一下正确的做法。
还是得使用hash,
但是问题在于,我们不能够遍历所有的子序列,如果遍历所有的子序列,妥妥的O(N*N),
因此,应该每次遍历一个完整的连续子序列,怎么遍历一个完整的连续子序列?
当然要从起点遍历到终点,
终点很好找,就是 e + 1在哈希表中不存在,
起点呢?也就很类似了,e - 1在hash表中不存在。
然后就从起点开始一直e++,直到 e - 1在hash表中不存在。
这么一看,还是要两重遍历啊,但是,两重遍历,时间复杂度不一定是O(N*N)啊,
仔细分析,实际上:
最外面一层O(N)肯定是有的,
中间的一层循环,只是遍历每一个连续序列,
nums有几个连续序列,这个循环才会走几遍,
这些连续序列的循环遍历,合起来其实就相当于遍历了一次nums,
总时间复杂度是O(2N),也就是O(N)级别,no problem。
代码
c
int longestConsecutive(vector<int>& nums) {
//这道题目的核心思路是从每个连续序列的起点开始遍历
//看似是O(n^n)的时间复杂度,
//但是只有遇到一个新的序列的时候,才会启动第二层while
//所有的第二层while拼接起来才是一个O(N)
//也就是说,时间复杂度应该是O(2 * N)也就是O(N)级别
//反倒是使用位图,看起来是O(N)的时间复杂度,
//但是由于位图中有非常多空位置/无效位置,浪费了相当多的空间
//最后的时间复杂度实际上是超过了O(N)的
if(nums.size() == 0) return 0;
unordered_set<int> hash(nums.begin(),nums.end());
int maxlen = INT_MIN;
for(auto& e:hash)
{
if(hash.count(e - 1) == 0) //e元素就是一个序列的起点
{
int count = 1;
int tmp = e;
while(hash.count(tmp+1))//看似是O(N^N)的时间复杂度
//但是实际上当有几个序列,就遍历几次额外的while
//这些额外的while遍历才是真正的遍历数组
{
count++;
tmp++;
}
maxlen = max(maxlen,count);
}
}
return maxlen;
}