Python 算法基础篇之什么是算法

1. 算法是什么？一个生活化的理解

1.1 从"做西红柿炒蛋"说起

想象你要教一个完全不会做饭的人做西红柿炒蛋，你会怎么写步骤？

复制代码

步骤1：准备2个西红柿，洗净切块
步骤2：打3个鸡蛋，加盐搅拌均匀
步骤3：热锅倒油，油热后倒入蛋液
步骤4：蛋液凝固后盛出备用
步骤5：锅中再倒少许油，放入西红柿翻炒
步骤6：西红柿出汁后倒入炒好的鸡蛋
步骤7：加盐调味，翻炒均匀后出锅

这就是算法！ 一系列明确的、有限的、可执行的步骤，用于解决特定问题（做出一道菜）。

1.2 算法的正式定义

算法（Algorithm） ：解决特定问题的一系列清晰指令，满足以下特性：

有穷性：必须在有限步骤内结束

确定性：每条指令含义明确，无歧义

可行性：每条指令都可以通过基本操作实现

输入：零个或多个输入

输出：至少一个输出

python 复制代码

# 算法 vs 程序
# 算法是"思想"，程序是"实现"

# 算法：找出列表中的最大值
# 思路：假设第一个最大，逐个比较更新

# 程序：Python 实现
def find_max(arr):
    if not arr:
        return None
    
    max_val = arr[0]          # 假设第一个最大
    for num in arr[1:]:       # 逐个比较
        if num > max_val:
            max_val = num     # 更新最大值
    return max_val

# 测试
numbers = [3, 1, 4, 1, 5, 9, 2, 6]
print(f"最大值是：{find_max(numbers)}")  # 9

1.3 算法无处不在

场景	算法在做什么
刷短视频	推荐算法判断你喜欢什么
地图导航	最短路径算法规划路线
扫码支付	加密算法保护交易安全
搜索引擎	排序算法+索引算法找到最相关结果
人脸识别	深度学习算法提取特征
快递分拣	调度算法优化配送路径

🎯 核心认知 ：算法不是程序员的专属，它是解决问题的通用方法论 。学算法，就是学如何高效思考。

2. 算法与程序：灵魂与躯壳

2.1 同一个算法，多种实现

问题：计算 1 + 2 + 3 + ... + 100

算法一：逐个累加（循环）

python 复制代码

def sum_naive(n):
    """逐个相加"""
    total = 0
    for i in range(1, n + 1):
        total += i
    return total

print(sum_naive(100))  # 5050

算法二：高斯求和公式（数学）

python 复制代码

def sum_gauss(n):
    """高斯算法：n * (n + 1) / 2"""
    return n * (n + 1) // 2

print(sum_gauss(100))  # 5050

算法三：递归

python 复制代码

def sum_recursive(n):
    """递归：sum(n) = n + sum(n-1)"""
    if n == 1:
        return 1
    return n + sum_recursive(n - 1)

print(sum_recursive(100))  # 5050

对比：

实现	时间复杂度	空间复杂度	特点
逐个累加	O(n)	O(1)	直观，但慢
高斯公式	O(1)	O(1)	最优，瞬间完成
递归	O(n)	O(n)	优雅，但有栈开销

💡 启示：算法决定效率的上限，程序决定实现的质量。高斯公式这个算法本身，就比逐个累加快无数倍------这是算法层面的碾压。

2.2 算法的层次

复制代码

┌─────────────────────────────────────────┐
│  第4层：数学算法（最优）                  │
│  如：高斯求和、矩阵快速幂                  │
├─────────────────────────────────────────┤
│  第3层：高级数据结构算法                   │
│  如：平衡树、图算法、动态规划              │
├─────────────────────────────────────────┤
│  第2层：基础算法                          │
│  如：排序、搜索、递归、分治               │
├─────────────────────────────────────────┤
│  第1层：暴力枚举                          │
│  如：逐个尝试所有可能                     │
└─────────────────────────────────────────┘

3. 为什么算法如此重要？

3.1 场景一：从"能用"到"好用"

假设你在开发一个用户搜索功能：

方案A：暴力搜索

python 复制代码

def search_users(users, keyword):
    """在用户列表中搜索，暴力匹配"""
    results = []
    for user in users:
        if keyword in user['name'] or keyword in user['email']:
            results.append(user)
    return results

# 1000个用户：0.1秒 ✓
# 100万个用户：100秒 ✗ 用户已经关闭页面了

方案B：使用索引（算法优化）

python 复制代码

from collections import defaultdict

class UserSearchEngine:
    def __init__(self):
        self.index = defaultdict(set)  # 倒排索引
    
    def add_user(self, user):
        """建立索引"""
        words = user['name'].lower().split()
        words += user['email'].lower().split('@')
        for word in words:
            self.index[word].add(user['id'])
    
    def search(self, keyword):
        """基于索引搜索"""
        keyword = keyword.lower()
        return self.index.get(keyword, set())

# 100万个用户：0.001秒 ✓✓✓
# 性能提升 10万倍！

🚀 这就是算法的威力 ：同样的功能，不同的算法，用户体验天差地别。

3.2 场景二：资源有限时的生存法则

真实案例：NASA 的火星探测器

复制代码

约束条件：
- 处理器：200MHz（比你的手机慢50倍）
- 内存：256MB
- 通信延迟：4~24分钟（地球到火星）
- 电量：太阳能，有限

没有优秀算法 = 任务失败

3.3 场景三：面试与职业发展的硬通货

复制代码

国内大厂面试算法题占比：
┌─────────────────┬─────────────┐
│ 公司            │ 算法题占比   │
├─────────────────┼─────────────┤
│ 字节跳动        │ 70%         │
│ 阿里巴巴        │ 60%         │
│ 腾讯            │ 55%         │
│ 美团            │ 65%         │
│ Google          │ 75%         │
│ Meta            │ 70%         │
└─────────────────┴─────────────┘

为什么？因为算法能力是"可迁移的智力"。

3.4 算法重要性的四个维度

复制代码

        效率
          ↑
    快 ←──┼──→ 省
   (时间) │  (空间)
          ↓
        正确

第5维度：可维护性（代码可读、可扩展）

4. 如何衡量算法的好坏？

4.1 不是"跑得快"这么简单

python 复制代码

import time

def test_performance():
    """同一算法在不同数据下的表现"""
    
    # 算法：冒泡排序
    def bubble_sort(arr):
        n = len(arr)
        for i in range(n):
            for j in range(0, n - i - 1):
                if arr[j] > arr[j + 1]:
                    arr[j], arr[j + 1] = arr[j + 1], arr[j]
        return arr
    
    # 测试不同规模
    for size in [100, 1000, 5000]:
        arr = list(range(size, 0, -1))  # 最坏情况：逆序
        
        start = time.time()
        bubble_sort(arr.copy())
        elapsed = time.time() - start
        
        print(f"规模 {size:5d}: {elapsed:.4f}秒")

test_performance()

典型输出：

复制代码

规模   100: 0.0012秒
规模  1000: 0.0891秒
规模  5000: 2.3124秒   ← 规模×5，时间×26！

⚠️ 问题：运行时间受硬件、语言、当前系统负载影响，不能作为衡量标准。

4.2 正确的衡量方式：复杂度分析

我们需要一种与机器无关 的衡量方式，关注算法本身的效率随数据规模增长的变化趋势。

5. 算法复杂度：Big O 表示法

5.1 什么是 Big O？

Big O 表示法：描述算法运行时间（或空间）随输入规模增长的变化趋势。

核心思想 ：当 n → ∞ 时，只保留增长最快的项，忽略常数和低阶项。

复制代码

精确计算：T(n) = 3n² + 5n + 100
Big O：   O(n²)  ← 只保留最高阶

为什么可以忽略？
当 n = 100万时：
  3n² = 3,000,000,000,000
  5n  = 5,000,000
  100 = 100
  5n + 100 相对于 3n² 可以忽略不计

5.2 常见复杂度对比

复杂度	名称	示例	n=10	n=100	n=1000
O(1)	常数	数组随机访问	1	1	1
O(log n)	对数	二分查找	3	7	10
O(n)	线性	遍历数组	10	100	1000
O(n log n)	线性对数	快速排序	30	700	10,000
O(n²)	平方	冒泡排序	100	10,000	1,000,000
O(n³)	立方	三重循环	1000	1,000,000	10⁹
O(2ⁿ)	指数	子集枚举	1024	≈10³⁰	≈10³⁰¹
O(n!)	阶乘	全排列	3,628,800	≈10¹⁵⁸	宇宙原子数≪

可视化增长曲线：

复制代码

操作次数 ↑
    │
1e30 ┤                    ★ 2ⁿ
     │                 ★
1e20 ┤              ★
     │           ★
 1e9 ┤        ★
     │     ★     ▲ n³
 1e6 ┤  ★     ▲
     │★    ▲
 1e3 ┤  ▲
     │▲
   10 ┼────┬────┬────┬────┬────→ n
     0   10   50  100  500  1000
        ★ = 指数  ▲ = 立方  ● = 平方  ■ = nlogn  ◆ = 线性  ◇ = 对数

5.3 复杂度分析实战

示例1：单层循环

python 复制代码

def example1(arr):
    """时间复杂度：O(n)"""
    total = 0
    for num in arr:      # 执行 n 次
        total += num
    return total

示例2：双层循环

python 复制代码

def example2(arr):
    """时间复杂度：O(n²)"""
    count = 0
    for i in arr:        # 执行 n 次
        for j in arr:    # 每次执行 n 次
            if i + j == 0:
                count += 1
    return count
# 总操作：n × n = n²

示例3：循环折半

python 复制代码

def example3(n):
    """时间复杂度：O(log n)"""
    count = 0
    while n > 0:         # n 每次减半
        n = n // 2
        count += 1
    return count

# n=16: 16→8→4→2→1，执行4次 = log₂16
# n=1024: 执行10次 = log₂1024

示例4：递归

python 复制代码

def example4(n):
    """时间复杂度：O(2ⁿ)"""
    if n <= 1:
        return 1
    return example4(n - 1) + example4(n - 1)

# 调用树：
#        f(4)
#      /      \
#    f(3)    f(3)
#   /   \    /   \
# f(2) f(2) f(2) f(2)
# ... 共 2⁴ - 1 = 15 个节点

5.4 空间复杂度

python 复制代码

def sum_iterative(n):
    """空间复杂度：O(1)"""
    total = 0
    for i in range(1, n + 1):
        total += i
    return total

def sum_recursive(n):
    """空间复杂度：O(n) - 调用栈深度"""
    if n == 1:
        return 1
    return n + sum_recursive(n - 1)

def create_matrix(n):
    """空间复杂度：O(n²)"""
    return [[0] * n for _ in range(n)]

6. Python 实现经典算法

6.1 搜索算法

线性搜索：O(n)

python 复制代码

def linear_search(arr, target):
    """逐个查找，最坏遍历全部"""
    for i, num in enumerate(arr):
        if num == target:
            return i          # 找到，返回索引
    return -1                 # 未找到

# 适用：无序数据，数据量小

二分搜索：O(log n)

python 复制代码

def binary_search(arr, target):
    """
    二分搜索：每次排除一半数据
    前提：数组必须有序！
    """
    left, right = 0, len(arr) - 1
    
    while left <= right:
        mid = (left + right) // 2
        
        if arr[mid] == target:
            return mid          # 找到！
        elif arr[mid] < target:
            left = mid + 1      # 目标在右半区
        else:
            right = mid - 1     # 目标在左半区
    
    return -1                   # 未找到

# 测试
sorted_arr = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
print(binary_search(sorted_arr, 7))   # 3
print(binary_search(sorted_arr, 10))  # -1

# 性能对比：
# 线性搜索 100万个元素：最坏100万次比较
# 二分搜索 100万个元素：最多20次比较！

6.2 排序算法

选择排序：O(n²)

python 复制代码

def selection_sort(arr):
    """
    思路：每次从未排序区选最小，放到已排序区末尾
    """
    n = len(arr)
    for i in range(n):
        min_idx = i
        for j in range(i + 1, n):
            if arr[j] < arr[min_idx]:
                min_idx = j
        arr[i], arr[min_idx] = arr[min_idx], arr[i]
    return arr

# 直观但低效，仅用于教学

快速排序：O(n log n) 平均

python 复制代码

def quick_sort(arr):
    """
    分治策略：
    1. 选基准（pivot）
    2. 分区：小于放左，大于放右
    3. 递归排序左右子数组
    """
    if len(arr) <= 1:
        return arr
    
    pivot = arr[len(arr) // 2]  # 选中间元素为基准
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    
    return quick_sort(left) + middle + quick_sort(right)

# 测试
arr = [64, 34, 25, 12, 22, 11, 90]
print(quick_sort(arr))  # [11, 12, 22, 25, 34, 64, 90]

归并排序：稳定 O(n log n)

python 复制代码

def merge_sort(arr):
    """分治：先分后合"""
    if len(arr) <= 1:
        return arr
    
    mid = len(arr) // 2
    left = merge_sort(arr[:mid])
    right = merge_sort(arr[mid:])
    
    return merge(left, right)

def merge(left, right):
    """合并两个有序数组"""
    result = []
    i = j = 0
    
    while i < len(left) and j < len(right):
        if left[i] <= right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    
    result.extend(left[i:])
    result.extend(right[j:])
    return result

6.3 排序算法性能对比

python 复制代码

import random
import time

def compare_sorts():
    """对比不同排序算法的实际性能"""
    
    algorithms = {
        "选择排序": selection_sort,
        "快速排序": quick_sort,
        "归并排序": merge_sort,
        "Python内置": sorted,
    }
    
    sizes = [100, 1000, 5000]
    
    print(f"{'规模':>8}", end="")
    for name in algorithms:
        print(f"{name:>12}", end="")
    print()
    print("-" * 60)
    
    for size in sizes:
        arr = [random.randint(1, 10000) for _ in range(size)]
        print(f"{size:>8}", end="")
        
        for name, func in algorithms.items():
            test_arr = arr.copy()
            start = time.time()
            func(test_arr)
            elapsed = time.time() - start
            print(f"{elapsed:>11.4f}s", end="")
        print()

compare_sorts()

典型输出：

复制代码

    规模  选择排序    快速排序    归并排序  Python内置
------------------------------------------------------------
     100    0.0012s    0.0003s    0.0004s    0.0000s
    1000    0.0891s    0.0021s    0.0032s    0.0001s
    5000    2.3124s    0.0123s    0.0187s    0.0008s

💡 为什么内置 sorted 最快？ Python 的 sorted() 使用 Timsort，是归并排序+插入排序的混合算法，针对真实数据高度优化。

7. 算法思维：从解题到创造

7.1 五大经典算法思想

复制代码

┌─────────────────────────────────────────────────────┐
│ 1. 枚举（暴力）                                       │
│    尝试所有可能，保证正确性                            │
│    例：密码破解、全排列                                │
├─────────────────────────────────────────────────────┤
│ 2. 分治（Divide and Conquer）                        │
│    大问题拆成小问题，分别解决后合并                     │
│    例：归并排序、快速排序、二分查找                     │
├─────────────────────────────────────────────────────┤
│ 3. 贪心（Greedy）                                    │
│    每一步选当前最优，期望全局最优                       │
│    例：找零钱、活动安排、最小生成树                     │
├─────────────────────────────────────────────────────┤
│ 4. 动态规划（Dynamic Programming）                    │
│    大问题依赖子问题，子问题重叠，记忆化存储               │
│    例：斐波那契、背包问题、最长公共子序列                │
├─────────────────────────────────────────────────────┤
│ 5. 回溯（Backtracking）                              │
│    深度搜索+剪枝，试探性解决问题                        │
│    例：八皇后、迷宫、数独、全排列                       │
└─────────────────────────────────────────────────────┘

7.2 算法思维训练：从"怎么做"到"为什么"

初级：知道怎么做

python 复制代码

# 题目：两数之和
def two_sum(nums, target):
    for i in range(len(nums)):
        for j in range(i + 1, len(nums)):
            if nums[i] + nums[j] == target:
                return [i, j]
    return []
# 能跑，但 O(n²)

进阶：知道为什么慢

python 复制代码

# 优化：用哈希表，O(n)
def two_sum_optimized(nums, target):
    seen = {}
    for i, num in enumerate(nums):
        complement = target - num
        if complement in seen:
            return [seen[complement], i]
        seen[num] = i
    return []
# 用空间换时间，从 O(n²) 降到 O(n)

高级：知道还能不能更好

python 复制代码

# 如果数组已排序？双指针，O(n)，空间 O(1)
def two_sum_sorted(nums, target):
    left, right = 0, len(nums) - 1
    while left < right:
        s = nums[left] + nums[right]
        if s == target:
            return [left, right]
        elif s < target:
            left += 1
        else:
            right -= 1
    return []

🎯 算法思维的核心：面对问题，先想"最优解是什么"，再想"怎么实现"，而不是"先写出来再说"。

8. 结语：算法之美

"算法 + 数据结构 = 程序" ------ Niklaus Wirth（图灵奖得主）

算法不是冰冷的代码，它是人类智慧的结晶。

当你写出第一个二分查找，你会惊叹：原来可以这么快！

当你理解动态规划，你会感叹：子问题重叠的优雅！

当你解决汉诺塔，你会震撼：递归分解的力量！

为什么每个人都该学算法？

训练逻辑思维：像计算机一样严谨思考
提升问题解决能力：面对复杂问题不再无从下手
打开职业大门：技术面试的通行证
理解世界：推荐系统、导航、AI 背后的原理
纯粹的智力愉悦：就像解出一道数学难题

🌟 最后的话：

算法学习没有捷径，但有方法。不要畏惧困难，每一道你攻克的题目，都在重塑你的大脑。从今天开始，每天进步一点点，一年后你会感谢现在的自己。

记住：

看懂 ≠ 会写
会写 ≠ 熟练
熟练 ≠ 创新

从模仿到创造，从练习到精通。算法之路，始于足下。