【算法基础】一文掌握十大排序算法,冒泡排序、插入排序、选择排序、归并排序、计数排序、基数排序、希尔排序和堆排序

目录

[1 冒泡排序(Bubble Sort)](#1 冒泡排序(Bubble Sort))

[2 插入排序(Insertion Sort)](#2 插入排序(Insertion Sort))

[3 选择排序(Selection Sort)](#3 选择排序(Selection Sort))

[4. 快速排序(Quick Sort)](#4. 快速排序(Quick Sort))

[5. 归并排序(Merge Sort)](#5. 归并排序(Merge Sort))

[6 堆排序 (Heap Sort)](#6 堆排序 (Heap Sort))

[7 计数排序 (Counting Sort)](#7 计数排序 (Counting Sort))

[8 基数排序 (Radix Sort)](#8 基数排序 (Radix Sort))

[9 希尔排序(Shell Sort)](#9 希尔排序(Shell Sort))

[10 桶排序](#10 桶排序)


1 冒泡排序(Bubble Sort)

冒泡排序是一种基本的排序算法,其核心思想是多次遍历待排序的元素,比较相邻的两个元素,如果它们的顺序不正确,则交换它们,直到整个数组按照指定顺序排列。

python 复制代码
def bubble_sort(arr):
    n = len(arr)
    for i in range(n):
        for j in range(0, n-i-1):
            # 比较相邻的两个元素
            if arr[j] > arr[j+1]:
                # 如果顺序不正确,则交换它们
                arr[j], arr[j+1] = arr[j+1], arr[j]

# 示例用法
arr = [64, 34, 25, 12, 22, 11, 90]
bubble_sort(arr)
print("冒泡排序后的数组:", arr)

冒泡排序通过多次遍历数组,每次比较相邻的两个元素,如果它们的顺序不正确就交换它们。这个过程将最大的元素逐渐"冒泡"到数组的末尾。

时间复杂度为 O(n^2),不适合大规模数据集。

2 插入排序(Insertion Sort)

插入排序是一种稳定的排序算法,其核心思想是将未排序的元素逐个插入到已排序的部分,从前往后遍历,保持前面的元素有序。

python 复制代码
def insertion_sort(arr):
    for i in range(1, len(arr)):
        key = arr[i]
        j = i - 1
        while j >= 0 and key < arr[j]:
            # 将较大的元素向右移动
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = key

# 示例用法
arr = [64, 34, 25, 12, 22, 11, 90]
insertion_sort(arr)
print("插入排序后的数组:", arr)

插入排序逐个将未排序的元素插入到已排序的部分,从前往后遍历,保持前面的元素有序。时间复杂度为 O(n^2),适合小规模数据集和部分有序的数据。

3 选择排序(Selection Sort)

选择排序是一种简单的不稳定排序算法,其核心思想是找到未排序部分的最小元素,将其与未排序部分的第一个元素交换位置。

python 复制代码
def selection_sort(arr):
    n = len(arr)
    for i in range(n):
        min_index = i
        for j in range(i+1, n):
            # 找到未排序部分的最小元素的索引
            if arr[j] < arr[min_index]:
                min_index = j
        # 交换最小元素与未排序部分的第一个元素
        arr[i], arr[min_index] = arr[min_index], arr[i]

# 示例用法
arr = [64, 34, 25, 12, 22, 11, 90]
selection_sort(arr)
print("选择排序后的数组:", arr)

选择排序通过多次选择未排序部分的最小元素,并将其与未排序部分的第一个元素交换位置来进行排序。时间复杂度为 O(n^2),不适合大规模数据集。

4. 快速排序(Quick Sort)

快速排序是一种高效的分治排序算法,它选择一个基准元素,将数组分成两部分,左边的元素都小于基准,右边的元素都大于基准,然后递归对左右两部分进行排序。

python 复制代码
def quick_sort(arr):
    # 基本情况:如果数组为空或只包含一个元素,无需排序
    if len(arr) <= 1:
        return arr
    
    # 选择中间元素作为基准点(pivot)
    pivot = arr[len(arr) // 2]
    
    # 将数组分成三部分:小于、等于、大于基准点的元素
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    
    # 递归排序左右两部分,然后合并结果
    return quick_sort(left) + middle + quick_sort(right)

# 示例用法
arr = [64, 34, 25, 12, 22, 11, 90]
arr = quick_sort(arr)
print("快速排序后的数组:", arr)
  • 快速排序是一种高效的分治排序算法,它通过选择一个基准点(通常是数组中的中间元素)将数组分成左右两部分,并递归地对左右两部分进行排序。
  • 基本情况是数组为空或只包含一个元素,无需排序。
  • 针对每个元素,将它与基准点进行比较,分成小于、等于和大于基准点的三个子数组。
  • 然后,递归地对左右两部分进行排序,最后将它们与基准点合并,形成一个有序的数组。

5. 归并排序(Merge Sort)

归并排序是一种稳定的分治排序算法,它将数组分成两半,分别排序,然后将已排序的两个子数组合并成一个有序数组。

python 复制代码
def merge_sort(arr):
    # 基本情况:如果数组为空或只包含一个元素,无需排序
    if len(arr) <= 1:
        return arr
    
    # 将数组分成两半
    mid = len(arr) // 2
    left = arr[:mid]
    right = arr[mid:]
    
    # 递归地对左右两部分进行排序
    left = merge_sort(left)
    right = merge_sort(right)
    
    # 合并已排序的左右两部分
    return merge(left, right)

def merge(left, right):
    result = []
    i = j = 0
    
    # 合并两个已排序的子数组
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    
    # 如果左边或右边的子数组还有剩余元素,将它们添加到结果中
    result.extend(left[i:])
    result.extend(right[j:])
    
    return result

# 示例用法
arr = [64, 34, 25, 12, 22, 11, 90]
arr = merge_sort(arr)
print("归并排序后的数组:", arr)
  • 归并排序是一种稳定的分治排序算法,它将数组递归分成两半,然后合并已排序的子数组。
  • 基本情况是数组为空或只包含一个元素,无需排序。
  • 递归地对左右两部分进行排序,然后使用 merge 函数将它们合并成一个有序的数组。
  • merge 函数将两个已排序的子数组合并,同时维护它们的有序性。

6 堆排序 (Heap Sort)

堆排序是一种不稳定的排序算法,它使用堆数据结构(通常是最大堆)来进行排序。堆排序分为两个主要步骤:建立堆和排序。

python 复制代码
def heapify(arr, n, i):
    largest = i
    left = 2 * i + 1
    right = 2 * i + 2

    # 找到左子节点和右子节点中的最大值
    if left < n and arr[left] > arr[largest]:
        largest = left

    if right < n and arr[right] > arr[largest]:
        largest = right

    # 如果最大值不是当前节点,交换它们
    if largest != i:
        arr[i], arr[largest] = arr[largest], arr[i]

def heap_sort(arr):
    n = len(arr)

    # 构建最大堆
    for i in range(n // 2 - 1, -1, -1):
        heapify(arr, n, i)

    # 一个接一个地从堆中取出元素,交换根节点与最后一个节点,然后重新构建堆
    for i in range(n - 1, 0, -1):
        arr[i], arr[0] = arr[0], arr[i]
        heapify(arr, i, 0)

# 示例用法
arr = [64, 34, 25, 12, 22, 11, 90]
heap_sort(arr)
print("堆排序后的数组:", arr)
  • 排序使用堆数据结构(通常是最大堆)来进行排序。首先构建最大堆,然后一个接一个地从堆中取出元素,交换根节点与最后一个节点,然后重新构建堆。
  • heapify 函数用于维护堆的性质,即父节点的值大于或等于子节点的值。
  • 这个算法的时间复杂度为 O(nlogn),是一种高效的排序算法。

7 计数排序 (Counting Sort)

计数排序是一种非比较排序算法,它根据输入元素的计数来对元素进行排序。它适用于整数或有限范围内的非负整数。

python 复制代码
def counting_sort(arr):
    max_val = max(arr)
    min_val = min(arr)
    range_of_elements = max_val - min_val + 1
    count_arr = [0] * range_of_elements
    output_arr = [0] * len(arr)

    # 计数每个元素的出现次数
    for num in arr:
        count_arr[num - min_val] += 1

    # 计算每个元素的累积计数
    for i in range(1, len(count_arr)):
        count_arr[i] += count_arr[i - 1]

    # 根据累积计数将元素放入输出数组
    for i in range(len(arr) - 1, -1, -1):
        output_arr[count_arr[arr[i] - min_val] - 1] = arr[i]
        count_arr[arr[i] - min_val] -= 1

    return output_arr

# 示例用法
arr = [4, 2, 2, 8, 3, 3, 1]
arr = counting_sort(arr)
print("计数排序后的数组:", arr)
  • 计数排序是一种非比较排序算法,适用于整数或有限范围内的非负整数。
  • 首先,计算每个元素的出现次数,然后计算每个元素的累积计数,最后根据累积计数将元素放入输出数组。
  • 这个算法的时间复杂度为 O(n+k),其中 k 是输入范围的大小。

8 基数排序 (Radix Sort)

基数排序是一种非比较排序算法,它将数字按照每个位数进行排序,从最低位到最高位,依次排列。

python 复制代码
def counting_sort(arr, exp):
    n = len(arr)
    output = [0] * n
    count = [0] * 10

    # 计数每个元素的出现次数
    for i in range(n):
        index = arr[i] // exp
        count[index % 10] += 1

    # 计算每个元素的累积计数
    for i in range(1, 10):
        count[i] += count[i - 1]

    # 根据累积计数将元素放入输出数组
    i = n - 1
    while i >= 0:
        index = arr[i] // exp
        output[count[index % 10] - 1] = arr[i]
        count[index % 10] -= 1
        i -= 1

    # 将输出数组的内容复制到原始数组中
    for i in range(n):
        arr[i] = output[i]

def radix_sort(arr):
    max_val = max(arr)
    exp = 1
    while max_val // exp > 0:
        counting_sort(arr, exp)
        exp *= 10

# 示例用法
arr = [170, 45, 75, 90, 802, 24, 2, 66]
radix_sort(arr)
print("基数排序后的数组:", arr)
  • 基数排序是一种非比较排序算法,它按照每个位数进行排序,从最低位到最高位,依次排列。
  • 首先使用计数排序对每个位数进行排序,然后再次对下一个位数进行排序,依次进行直到最高位。
  • 这个算法的时间复杂度为 O(nk),其中 k 是数字的最大位数。

9 希尔排序(Shell Sort)

希尔排序(Shell Sort)是一种插入排序的改进版本,也被称为缩小增量排序。希尔排序通过将数组分成若干个子序列来排序数据,然后逐渐缩小子序列的间隔,最终得到一个完全排序的数组。希尔排序的主要思想是提前交换较远的元素,以加快排序过程。

算法原理

  1. 选择一个增量序列(间隔序列),通常选择的增量是数组长度的一半,然后逐渐减小增量。

  2. 对于每个增量,将数组分成若干个子序列,每个子序列使用插入排序进行排序。

  3. 重复步骤2,逐渐减小增量,直到增量为1。

  4. 当增量为1时,整个数组成为一个序列,使用插入排序对其进行排序。

python 复制代码
def shell_sort(arr):
    n = len(arr)
    gap = n // 2  # 初始增量取数组长度的一半

    while gap > 0:
        for i in range(gap, n):
            temp = arr[i]
            j = i
            # 使用插入排序对子序列进行排序
            while j >= gap and arr[j - gap] > temp:
                arr[j] = arr[j - gap]
                j -= gap
            arr[j] = temp
        gap //= 2  # 缩小增量

# 示例用法
arr = [64, 34, 25, 12, 22, 11, 90]
shell_sort(arr)
print("希尔排序后的数组:", arr)

希尔排序的关键在于选择合适的增量序列。常见的增量序列有希尔增量、Hibbard增量、Knuth增量等,不同的增量序列会影响排序的性能。

  • 希尔排序的时间复杂度取决于增量序列的选择,平均时间复杂度通常在 O(n^1.25) 到 O(n^2) 之间,比插入排序要快。

  • 希尔排序是一种不稳定排序算法,适用于中等大小的数据集。虽然不如快速排序和归并排序快,但在某些情况下比插入排序更快。希尔排序通常用于嵌入式系统等资源有限的环境。

10 桶排序(Bucket Sort)

桶排序(Bucket Sort)是一种分布式排序算法,它将元素分散到一组桶中,然后对每个桶中的元素进行排序,最后将所有桶中的元素按顺序合并成一个有序序列。桶排序适用于元素均匀分布在一个范围内的情况,特别适用于浮点数排序。

算法原理

  1. 确定桶的数量和范围,通常根据输入数据的分布来选择桶的数量。如果元素均匀分布在一个范围内,那么可以选择桶的数量等于元素的数量。

  2. 将每个元素分配到相应的桶中。元素的分配可以采用不同的方法,例如线性划分或哈希函数。

  3. 对每个桶中的元素进行排序,可以使用任何排序算法,通常选择插入排序。

  4. 合并所有桶中的元素,按照桶的顺序得到最终的有序序列。

python 复制代码
def bucket_sort(arr):
    # 确定桶的数量,这里选择与输入元素数量相同
    n = len(arr)
    if n <= 1:
        return arr

    # 初始化桶
    max_val = max(arr)
    min_val = min(arr)
    bucket_range = (max_val - min_val) / n  # 每个桶的范围
    bucket_count = n  # 桶的数量等于元素数量
    buckets = [[] for _ in range(bucket_count)]

    # 将元素分配到桶中
    for num in arr:
        index = int((num - min_val) / bucket_range)
        buckets[index].append(num)

    # 对每个桶中的元素进行排序
    for i in range(bucket_count):
        buckets[i].sort()

    # 合并所有桶中的元素
    sorted_arr = []
    for bucket in buckets:
        sorted_arr.extend(bucket)

    return sorted_arr

# 示例用法
arr = [0.897, 0.565, 0.656, 0.1234, 0.665, 0.3434]
arr = bucket_sort(arr)
print("桶排序后的数组:", arr)

桶排序的性能取决于桶的数量和元素的分布。如果元素均匀分布在一个范围内,并且桶的数量足够多,那么桶排序可以非常高效。

  • 桶排序的时间复杂度通常为 O(n + k),其中 n 是元素的数量,k 是桶的数量。

  • 桶排序是一种稳定排序算法,适用于浮点数排序等特定情况。不过,它需要额外的内存空间来存储桶,因此不适用于数据集非常大的情况。

相关推荐
Yan.love7 分钟前
开发场景中Java 集合的最佳选择
java·数据结构·链表
AC使者13 分钟前
#B1630. 数字走向4
算法
ROBOT玲玉14 分钟前
Milvus 中,FieldSchema 的 dim 参数和索引参数中的 “nlist“ 的区别
python·机器学习·numpy
冠位观测者17 分钟前
【Leetcode 每日一题】2545. 根据第 K 场考试的分数排序
数据结构·算法·leetcode
古希腊掌管学习的神1 小时前
[搜广推]王树森推荐系统笔记——曝光过滤 & Bloom Filter
算法·推荐算法
qystca1 小时前
洛谷 P1706 全排列问题 C语言
算法
Kai HVZ1 小时前
python爬虫----爬取视频实战
爬虫·python·音视频
古希腊掌管学习的神1 小时前
[LeetCode-Python版]相向双指针——611. 有效三角形的个数
开发语言·python·leetcode
浊酒南街1 小时前
决策树(理论知识1)
算法·决策树·机器学习
m0_748244831 小时前
StarRocks 排查单副本表
大数据·数据库·python