转码刷 LeetCode 笔记[1]:3.无重复字符的最长子串(python)

题目描述

初次错解

看 B 站视频后,了解到"滑动窗口"思想,遂自己动手尝试

python 复制代码
class Solution:
    def lengthOfLongestSubstring(self, s: str) -> int:
        left = 0
        lenth = 0
        max_lenth = 0
        s = list(s)
        str = []
        for char in s:
            right = 0
            if char not in str:
                str.append(char)
                right += 1
                lenth = len(str)
                if lenth > max_lenth:
                    max_lenth = lenth
            else:
                str.remove(char)
                left += 1
        return max_lenth

答案分析

输入"abcabcbb",输出的是5,正确结果是3

输入"pwwkew",输出4,正确结果是3

第二次的解法

下面是 AI 根据我的解法修正的答案:

python 复制代码
class Solution:
    def lengthOfLongestSubstring(self, s: str) -> int:
        left = 0
        lenth = 0
        max_lenth = 0
        seen = set()
        for right in range(len(s)):
            while s[right] in seen:
                seen.remove(s[left])
                left += 1
            seen.add(s[right])
            lenth = right - left + 1
            if lenth > max_lenth:
                max_lenth = lenth

        return max_lenth

我错哪了呢?

没有真正维护滑动窗口的左边界,只是 left += 1,但 str 中并没有正确地移除所有在左边界左边的字符;
remove(char) 只会移除第一个匹配项,这会导致窗口状态不一致;

也没有用 left 来限制窗口范围,只是把它当成一个计数器。

观察我的答案和修正之后的答案,产生了几个问题:

  1. seen = set()为什么用set不用list,二者有什么区别?
  2. 为什么seen.remove(s[left])能移除所有在左边界左边的字符,而str.remove(char)不能?
  3. while s[right] in seen: 改成 for s[right] in seen: 是不是没有区别?
  4. 子串长度为什么用right - left + 1计算,而不用len(seen)计算?
  5. seen = set()seen={} 有什么区别?

下面来逐一解答

1. seen = set()为什么用 set 不用 list,二者有什么区别?

特性 set list
查找速度 O(1)(哈希表实现) O(n)(线性扫描)
是否允许重复 ❌ 不允许重复元素 ✅ 允许重复元素
是否保持顺序 ❌ 不保持插入顺序(Python 3.7+ 中 set 会保留插入顺序,但不依赖它) ✅ 保持插入顺序

2. 为什么seen.remove(s[left])能移除所有在左边界左边的字符,而str.remove(char)不能?

python 复制代码
str.remove(char)

这行代码的意思是:从 list 中删除第一个 等于 char 的元素;它不会删除所有在左边界左边的字符;它只是把第一次出现的那个字符删掉;所以窗口状态就乱了,并没有真正"滑动"窗口。

python 复制代码
while s[right] in seen:
    seen.remove(s[left])
    left += 1

通过 while 循环,可以只要出现重复字符,就删掉一次该字符,并实现左边界右移,直到窗口中没有重复子串为止。

关于循环,进而又产生了新的问题

3. while s[right] in seen: 改成 for s[right] in seen: 是不是没有区别?

有区别!

语法层面的错误

for s[right] in seen: 试图把 seen 中的每个元素赋值给 s[right],也就是试图修改原字符串 s 的内容 ------ 这是不允许的(字符串是不可变的),会报错:

TypeError: 'str' object does not support item assignment

逻辑层面的错误

for 循环会遍历 set 中的每个元素,而不是只要重复就一直删。

4. 子串长度为什么用right - left + 1计算,而不用len(seen)计算?

right - left + 1 是窗口的实际长度,也就是从 left 到 right 之间的子串长度

len(seen) 是不重复的字符数量,当把题目改为"允许最多两个重复"时,len(seen)输出的结果就不是子串长度了

只是在这道题中,这两个值相等。

5. seen = set()seen={} 有什么区别?

纯纯的基础不牢!刷题刷懵了!

seen = set()是创建一个空集合
seen={}是创建一个空字典

写法 类型 是否可哈希去重
set() set ✅ 是
{} dict ❌ 否
相关推荐
修钩.4 小时前
力扣 Pandas 挑战(5)---数据分组
算法·leetcode·pandas
茴香豆的茴15 小时前
转码刷 LeetCode 笔记[1]:3.无重复字符的最长子串(python)
笔记·算法·leetcode
快去睡觉~5 小时前
力扣46:全排列
算法·leetcode·动态规划
蒋星熠5 小时前
字母异位词分组(每天刷力扣hot100系列)
开发语言·c++·算法·leetcode·职场和发展
刚入坑的新人编程8 小时前
暑期算法训练.11
数据结构·c++·算法·leetcode·链表
zjoy_22339 小时前
[算法]Leetcode3487
java·学习·算法·leetcode
蒟蒻小袁9 小时前
力扣面试150题--只出现一次的数字II
算法·leetcode·面试
YuTaoShao11 小时前
【LeetCode 热题 100】20. 有效的括号
java·linux·数据库·leetcode
Dream it possible!14 小时前
LeetCode 面试经典 150_数组/字符串_买卖股票的最佳时机(7_121_C++_简单)(贪心)
c++·leetcode·面试·贪心算法