寻找数组中缺失数字:多种算法详解与比较

引言

在编程面试和算法学习中,"寻找缺失数字"是一个经典问题。给定一个包含0到n的所有整数但缺失一个的数组,如何高效地找出缺失的数字?本文将详细介绍两种解决方案:高效的异或法和直观的排序法,并分析它们的优缺点。

目录

引言

问题描述

方法一:异或法(最优解)

算法原理

代码实现

算法分析

工作原理

方法二:排序法(直观但低效)

算法原理

代码实现

算法分析

工作原理

其他可行方法

数学求和法

哈希表法

方法比较

总结


问题描述

数组nums包含从0到n的所有整数,但其中缺了一个。需要编写代码找出那个缺失的整数。

示例:

  • 输入:3,0,1 → 输出:2

  • 输入:9,6,4,2,3,5,7,0,1 → 输出:8

方法一:异或法(最优解)

算法原理

利用异或运算的特性:

  • 相同数字异或结果为0:a ^ a = 0

  • 0与任何数异或结果为其本身:0 ^ a = a

  • 异或满足交换律和结合律

代码实现

复制代码
int missingNumber(int* nums, int numsSize) 
{
    int result = numsSize; // 初始化为n
    for (int i = 0; i < numsSize; i++) 
    {
        result ^= i;        // 异或所有索引值
        result ^= nums[i];  // 异或所有数组元素
    }
    return result;
}

算法分析

  • 时间复杂度:O(n) - 只需遍历数组一次

  • 空间复杂度:O(1) - 只使用常数级别的额外空间

  • 优点:高效,不会出现整数溢出问题

  • 缺点:原理相对复杂,需要理解异或运算

工作原理

通过将索引值(0到n-1)和数组元素进行异或,所有成对出现的数字都会相互抵消为0,最终只剩下缺失的数字。

示例演示(nums = 3,0,1, n=3):

复制代码
初始: result = 3
i=0: 3 ^ 0 ^ 3 = 0
i=1: 0 ^ 1 ^ 0 = 1  
i=2: 1 ^ 2 ^ 1 = 2
结果: 2

方法二:排序法(直观但低效)

算法原理

先对数组进行排序,然后遍历数组找到第一个索引与数值不匹配的位置。

代码实现

复制代码
// 冒泡排序函数
void bubbleSort(int* arr, int n) 
{
    for (int i = 0; i < n - 1; i++) 
    {
        for (int j = 0; j < n - i - 1; j++) 
        {
            if (arr[j] > arr[j + 1]) 
            {
                int temp = arr[j];
                arr[j] = arr[j + 1];
                arr[j + 1] = temp;
            }
        }
    }
}

int missingNumber(int* nums, int numsSize) 
{
    // 使用冒泡排序对数组进行排序
    bubbleSort(nums, numsSize);
    
    // 遍历查找缺失的数字
    for (int i = 0; i < numsSize; i++) 
    {
        if (nums[i] != i) 
        {
            return i;
        }
    }
    
    return numsSize;
}

算法分析

  • 时间复杂度:O(n²) - 冒泡排序的时间复杂度

  • 空间复杂度:O(1) - 原地排序,不需要额外空间

  • 优点:思路直观,容易理解

  • 缺点:时间复杂度高,不适合大数据集

工作原理

示例演示(nums = 3,0,1):

  1. 排序后数组:0,1,3

  2. 遍历比较:

    • i=0: nums0=0 ✓

    • i=1: nums1=1 ✓

    • i=2: nums2=3 ≠ 2 → 返回2

其他可行方法

数学求和法

复制代码
int missingNumber(int* nums, int numsSize) {
    int total_sum = numsSize * (numsSize + 1) / 2;
    int actual_sum = 0;
    for (int i = 0; i < numsSize; i++) {
        actual_sum += nums[i];
    }
    return total_sum - actual_sum;
}
  • 时间复杂度:O(n)

  • 空间复杂度:O(1)

  • 注意:可能发生整数溢出

哈希表法

使用哈希表记录出现的数字,然后遍历0到n查找缺失值。

  • 时间复杂度:O(n)

  • 空间复杂度:O(n)

方法比较

方法 时间复杂度 空间复杂度 优点 缺点
异或法 O(n) O(1) 最高效,无溢出风险 理解难度稍高
数学求和 O(n) O(1) 直观易懂 可能整数溢出
哈希表 O(n) O(n) 思路清晰 需要额外空间
排序法 O(n²) O(1) 最直观 效率低

总结

对于"寻找缺失数字"问题,我们有多种解决方案:

  1. 异或法是最优选择,兼具高效性和安全性,特别适合面试场景

  2. 数学求和法在数据量不大时是不错的备选方案,思路简单明了

  3. 排序法虽然直观,但由于时间复杂度高,在实际应用中应避免使用

  4. 哈希表法在需要保持原数组不变时可以考虑

在面试中,建议先提出数学求和法展示基础思路,然后指出可能的溢出问题,最后给出异或法作为优化方案,这样能全面展示问题分析能力和算法知识。

选择算法时,应根据具体场景权衡时间效率、空间开销和代码可读性,异或法在大多数情况下都是最佳选择。

相关推荐
先吃饱再说3 小时前
判断回文字符串,从一行代码到双指针优化
算法
黄敬峰6 小时前
深入理解算法核心:从递归思想、数组扁平化到快速排序
算法
得物技术7 小时前
从狂野代码到按目标生产:得物推荐 AI Harness 的工程化实践|AICon 演讲整理
人工智能·算法·架构
AI小老六10 小时前
SkillOpt 架构拆解:把 Skill 文本当参数,用执行轨迹训练 Agent
后端·算法·ai编程
胡萝卜术11 小时前
从“分数打架”到“排名投票”:为什么你的ChatBI必须用RRF?
算法·设计模式·面试
Asize11 小时前
初识DFS 与 BFS:递归、队列与图遍历
算法
罗西的思考1 天前
机器人 / 强化学习】HIL-SERL:人类在环驱动的具身智能进化框架
人工智能·算法·机器学习
CSharp精选营1 天前
关系型 vs 非关系型:从原理到选型,一文搞定数据库核心分类
数据结构·nosql·关系型数据库·非关系型数据库·技术选型
美团技术团队1 天前
LongCat 开源 VitaBench 2.0:长期动态智能体基准新标杆
人工智能·算法