【码道初阶】【LeetCode387】如何高效找到字符串中第一个不重复的字符?

算法精解:如何高效找到字符串中第一个不重复的字符?

在处理字符串处理类算法题时,"频率统计"是一个核心思想。今天我们将通过 LeetCode 387. 字符串中的第一个唯一字符 这道经典题目,深入探讨两种主流解法:数组映射法HashMap 计数法

1. 题目描述

给定一个字符串 s,找到它的第一个不重复的字符,并返回它的索引。如果不存在,则返回 -1

示例:

  • 输入: s = "leetcode" -> 输出: 0
  • 输入: s = "loveleetcode" -> 输出: 2
  • 输入: s = "aabb" -> 输出: -1

提示:

  • s 只包含小写字母。
  • 字符串长度可达 10510^5105。

2. 核心解题思路:两次遍历

无论是使用数组还是 HashMap,其核心逻辑都是相同的,即**"空间换时间"**。

  1. 第一轮遍历: 扫描整个字符串,统计每个字符出现的总次数。
  2. 第二轮遍历: 再次按索引顺序扫描字符串,检查当前字符在统计表中的次数是否为 1。第一个满足条件的索引即为答案。

3. 解法一:数组映射法(常规方法)

代码实现

java 复制代码
class Solution {
    public int firstUniqChar(String s) {
        // 因为小写字母 ASCII 码或扩展 ASCII 范围内,256 足够覆盖
        int[] count = new int[256];
        
        // 1. 统计频率
        for(int i = 0; i < s.length(); i++){
            count[s.charAt(i)]++;
        }
        
        // 2. 查找第一个频率为 1 的字符索引
        for(int i = 0; i < s.length(); i++){
            if(1 == count[s.charAt(i)]) return i;
        }
        
        return -1;
    }
}

深度解析

  • 原理: 数组本质上是一个简单的哈希表。字符的 ASCII 值作为数组的下标(Index),数组存储的值(Value)则是出现的次数。
  • 空间优化: 题目提示只包含小写字母,其实可以使用 int[26] 的数组,通过 s.charAt(i) - 'a' 将字符映射到 0-25 索引。使用 int[256] 更加通用,可以处理所有标准 ASCII 字符。
  • 优点: 访问数组的时间复杂度是 O(1)O(1)O(1),且没有哈希冲突和额外的对象开销,执行速度极快。

4. 解法二:HashMap 计数法

代码实现

java 复制代码
class Solution {
    public int firstUniqChar(String s) {
        // 使用 HashMap 存储字符及其出现次数
        HashMap<Character, Integer> count = new HashMap<>();
        
        // 1. 统计频率
        for(int i = 0; i < s.length(); i++){
            char c = s.charAt(i);
            // 如果不存在则存入1,存在则在原值基础上+1
            count.put(c, count.getOrDefault(c, 0) + 1);
        }
        
        // 2. 查找第一个频率为 1 的字符索引
        for(int i = 0; i < s.length(); i++){
            if(count.get(s.charAt(i)) == 1) return i;
        }
        
        return -1;
    }
}

深度解析

  • 原理: 利用 HashMap 的键值对(Key-Value)结构。Key 存储字符 Character,Value 存储该字符出现的次数 Integer
  • 代码逻辑:
    • count.getOrDefault(c, 0) + 1 是一个优雅的写法,它代替了 if(!containsKey) 的条件判断,使代码更简洁。(虽然也可以使用HashMap的containsKey方法来检测是不是已经有了某个字符,但getOrDefault方法明显更加先进,直接内含了判断字符是否存在的逻辑,是就返回value(题中代码是返回的value+1),不存在就返回默认value(0)(题中代码在key不存在时,首次加入key的value也是0+1))
  • 优点:
    1. 通用性强: 如果题目要求处理的是中文字符、特殊符号或任意 Unicode 字符,数组法会因为范围太大失效,而 HashMap 可以轻松应对。
    2. 易读性: 键值对语义明确,代码逻辑更符合直觉。

5. 两种解法对比分析

维度 解法一:数组 (Array) 解法二:HashMap
时间复杂度 O(N)O(N)O(N) - 遍历两次字符串 O(N)O(N)O(N) - 遍历两次字符串
空间复杂度 O(1)O(1)O(1) - 固定大小 (256 或 26) O(1)O(1)O(1) 或 O(k)O(k)O(k) - 字符集大小
实际效率 极高(直接内存访问) 一般(涉及对象开销、哈希计算)
适用场景 字符范围固定(如仅字母/ASCII) 字符范围未知或非常分散(如全 Unicode)

为什么数组通常更快?

在 Java 中,HashMap 需要对基本类型进行装箱(intInteger),并且在计算哈希槽、处理链表或红黑树结构时有额外的计算开销。而数组是连续的内存空间,CPU 缓存命中率更高。


6. 总结

  • 如果面试题限制了小写字母 ,优先选择 数组法,它的性能表现最完美。
  • 如果面试题扩展到任意字符 或需要更高的代码通用性 ,使用 HashMap 是更成熟的工程实践。

核心套路牢记: 凡是涉及"第一个唯一"、"重复元素"、"频率统计"的问题,空间换时间(哈希思想) 永远是你的首选策略!

相关推荐
Kk.08027 小时前
Linux(十一)fork实例练习、文件操作示例及相关面试题目分享
linux·运维·算法
潇冉沐晴7 小时前
2026CCCC第三次模拟赛 部分题解
算法
WolfGang0073218 小时前
代码随想录算法训练营 Day32 | 动态规划 part05
算法·动态规划
wjs20248 小时前
JavaScript 条件语句
开发语言
lulu12165440788 小时前
Claude Code Harness架构技术深度解析:生产级AI Agent工程化实践
java·人工智能·python·ai编程
阿里加多8 小时前
第 1 章:Go 并发编程概述
java·开发语言·数据库·spring·golang
碧海银沙音频科技研究院8 小时前
1-1杰理蓝牙SOC的UI配置开发方法
人工智能·深度学习·算法
一 乐8 小时前
物流信息管理|基于springboot + vue物流信息管理系统(源码+数据库+文档)
java·数据库·vue.js·spring boot·论文·毕设·物流信息管理系统